Theo hiểu biết của tôi, khoảng cách của Cook đo lường mức độ ảnh hưởng của từng quan sát bằng cách loại trừ các điểm khi lắp mô hình. Vì vậy, tôi cho rằng nó có thể là một cách tiếp cận hợp lý để phát hiện ngoại lệ?
Câu hỏi của tôi, giả sử dữ liệu được phân loại thành các nhóm, có thể sử dụng khoảng cách của Cook để phát hiện nhóm "ngoại lệ" thay vì điểm ngoại lệ không? Có phải khoảng cách của Cook là một lựa chọn tốt về đo lường ảnh hưởng của nhóm.
influence()
. Tôi có một câu hỏi khác về ngưỡng. Vì 4 / N thông thường là "quá nhạy cảm" phát hiện ngoại lệ, trong khi tôi chỉ quan tâm đến nhóm / điểm có ảnh hưởng cực lớn. @jchaykow