Kurtosis biện pháp ngoại lệ. Các ngoại lệ là vấn đề đối với các suy luận tiêu chuẩn (ví dụ: kiểm tra t, khoảng t) dựa trên phân phối chuẩn. Đó là kết thúc của câu chuyện! Và đó thực sự là một câu chuyện khá đơn giản.
Lý do câu chuyện này không được đánh giá cao là bởi vì truyền thuyết cổ xưa rằng các biện pháp kurtosis "đỉnh cao" vẫn tồn tại.
Dưới đây là một lời giải thích đơn giản cho thấy lý do tại sao kurtosis đo lường các ngoại lệ và không phải là "đỉnh điểm".
Hãy xem xét các tập dữ liệu sau đây.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Kurtosis là giá trị mong đợi của (giá trị z) ^ 4. Dưới đây là (giá trị z) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
Trung bình là 2,78, và đó là ước tính của kurtosis. (Trừ 3 nếu bạn muốn kurtosis dư thừa.)
Bây giờ, thay thế giá trị dữ liệu cuối cùng bằng 999 để nó trở thành ngoại lệ:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Bây giờ, đây là (giá trị z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
Trung bình là 18,05, và đó là ước tính của kurtosis. (Trừ 3 nếu bạn muốn kurtosis dư thừa.)
Rõ ràng, chỉ có (các) ngoại lệ. Không có gì về "đỉnh" hoặc dữ liệu gần các vấn đề trung bình.
Nếu bạn thực hiện phân tích thống kê tiêu chuẩn với bộ dữ liệu thứ hai, bạn sẽ gặp rắc rối. Kurtosis lớn cảnh báo bạn về vấn đề.
Đây là một bài viết chi tiết:
Tây, PH (2014). Kurtosis như đỉnh cao, 1905 - 2014. RIP Nhà thống kê người Mỹ, 68, 191 Phản 195.