Hãy tưởng tượng bất kỳ dòng hồi quy phù hợp với một số dữ liệu.
Bây giờ hãy tưởng tượng một điểm dữ liệu bổ sung, một khoảng cách xa hơn so với phần chính của dữ liệu, nhưng một điểm nằm ở đâu đó dọc theo đường hồi quy đó.
Nếu đường hồi quy được chỉnh lại, các hệ số sẽ không thay đổi. Ngược lại, xóa các ngoại lệ thêm sẽ không ảnh hưởng đến các hệ số.
Vì vậy, một điểm ngoại lệ hoặc điểm đòn bẩy sẽ không có ảnh hưởng nếu nó hoàn toàn phù hợp với phần còn lại của dữ liệu và mô hình mà phần còn lại ngụ ý.
Đối với "dòng" đọc "mặt phẳng" hoặc "siêu phẳng" nếu muốn, nhưng ví dụ đơn giản nhất về hai biến và biểu đồ phân tán là đủ ở đây.
Tuy nhiên, vì bạn thích các định nghĩa - thông thường, dường như, có xu hướng đọc quá nhiều vào chúng - đây là định nghĩa yêu thích của tôi về các ngoại lệ:
"Outliers là các giá trị mẫu gây bất ngờ liên quan đến phần lớn mẫu" (WN Venables và BD Ripley. 2002. Thống kê áp dụng hiện đại với S. New York: Springer, tr.119).
Điều quan trọng, sự ngạc nhiên là trong tâm trí của người hành xử và phụ thuộc vào một số mô hình ngầm hoặc rõ ràng của dữ liệu. Có thể có một mô hình khác theo đó ngoại lệ không đáng ngạc nhiên chút nào, giả sử nếu dữ liệu thực sự là logic hoặc gamma hơn là bình thường.
Tái bút: Tôi không nghĩ rằng các điểm đòn bẩy nhất thiết thiếu các quan sát lân cận. Ví dụ, chúng có thể xảy ra theo cặp.