Quan sát rằng trong một ví dụ liên quan đến dữ liệu được rút ra từ phân phối Gaussian bị ô nhiễm, bạn sẽ có được ước tính tốt hơn về các tham số mô tả phần lớn dữ liệu bằng cách sử dụng thay vì med | x - med ( x ) | nơi điên (điêntrung gian | x - med ( x ) | là:điên ( x )
điên = 1.4826 × med | x - med ( x ) |
--tại đó, là một yếu tố nhất quán được thiết kế để đảm bảo rằng E ( điên ( x ) 2 ) = Var ( x )( Φ- 1( 0,75 ) )- 1= 1.4826
E ( điên ( x )2) = Biến ( x )
khi
là uncontaminated-- ban đầu được thực hiện bởi Gauss (Walker , H. (1931)).
x
Tôi không thể nghĩ ra bất kỳ lý do nào để không sử dụng thay vì trung bình mẫu trong trường hợp này. Hiệu quả thấp hơn (tại Gaussian!) Của mad có thể là một lý do để không sử dụng mad trong ví dụ của bạn. Tuy nhiên, có tồn tại những sự thay thế mạnh mẽ và hiệu quả cao cho người điên . Một trong số đó là Q ntrung gianđiênđiênđiênQn. Dự toán này có nhiều lợi thế khác bên cạnh. Nó cũng rất vô cảm với những người ngoài cuộc (thực tế gần như vô cảm như người điên). Trái ngược với sự điên rồ, nó không được xây dựng xung quanh ước tính vị trí và không cho rằng sự phân phối của phần không bị nhiễm bẩn của dữ liệu là đối xứng. Giống như điên, Nó dựa trên số liệu thống kê đơn hàng, để nó luôn được xác định rõ ngay cả khi phân phối cơ bản của mẫu của bạn không có khoảnh khắc. Giống như điên, Nó có một hình thức rõ ràng đơn giản. Thậm chí còn hơn cả sự điên rồ, tôi thấy không có lý do nào để sử dụng độ lệch chuẩn mẫu thay vì trong ví dụ bạn mô tả (xem Rousseeuw và Croux 1993 để biết thêm thông tin vềQn ).Qn
x ~ Γ ( ν, λ )
med ( x ) ≈ bước sóng ( ν- 1 / 3 )
và
điên ( x ) ≈ bước sóng v--√
ν> 1,5
ν^= ( trung bình ( x )điên ( x ))2
và
λ^= điên ( x )2trung gian ( x )
Xem Chen và Rubin (1986) cho một dẫn xuất hoàn chỉnh.
- J. Chen và H. Rubin, 1986. Giới hạn cho sự khác biệt giữa trung bình và trung bình của các phân phối Gamma và Poisson, Statist. Con mồi Lett., 4, 281 Từ283.
- PJ Rousseeuw và C. Croux, 1993. Các lựa chọn thay thế cho Tạp chí sai lệch tuyệt đối trung bình của Hiệp hội thống kê Hoa Kỳ, Vol. 88, số 424, trang 1273-1283
- Walker, H. (1931). Các nghiên cứu trong Lịch sử của Phương pháp Thống kê. Baltimore, MD: Williams & Wilkins Co. Trang 24 Ảo25.