Các liên kết trong câu hỏi nói về SAS quá. Nhưng trên thực tế không có gì trong câu hỏi này, ngoại trừ khả năng tập trung của chính người đăng, giới hạn nó trong các chương trình được đặt tên cụ thể đó.
Tôi nghĩ rằng chúng ta cần tách ra các loại vấn đề khá khác nhau ở đây, một số trong số đó là ảo tưởng và một số trong đó là chính hãng.
Một số chương trình thực hiện, và một số thì không, trừ 3 để số đo kurtosis được báo cáo là 3 cho các biến Gaussian / bình thường không trừ và 0 với phép trừ. Tôi đã thấy mọi người bối rối bởi điều đó, thường khi sự khác biệt hóa ra là 2.999 và không chính xác là 3.
Một số chương trình sử dụng các yếu tố hiệu chỉnh được thiết kế để đảm bảo rằng sự suy yếu được ước tính mà không có sai lệch. Các hệ số hiệu chỉnh tiếp cận 1 khi cỡ mẫu trở nên lớn hơn. Vì kurtosis không được ước tính tốt trong các mẫu nhỏ, nên điều này không đáng quan tâm lắm.n
Vì vậy, có một vấn đề nhỏ về công thức, # 1 là một vấn đề lớn hơn nhiều so với # 2, nhưng cả hai đều nhỏ nếu hiểu. Lời khuyên rõ ràng là xem xét tài liệu cho chương trình bạn đang sử dụng, và nếu không có tài liệu nào giải thích loại chi tiết đó để từ bỏ chương trình đó ngay lập tức. Nhưng một trường hợp thử nghiệm đơn giản như một biến số (1, 2) mang lại mức độ tổn thương là 1 hoặc 4 tùy thuộc vào số 1 (không có hệ số hiệu chỉnh).
Câu hỏi sau đó hỏi về giải thích, nhưng đây là một vấn đề cởi mở và gây tranh cãi hơn nhiều.
Trước khi chúng ta đến khu vực thảo luận chính, một khó khăn thường được báo cáo nhưng ít được biết đến là các ước tính kurtosis được giới hạn như một hàm của cỡ mẫu. Tôi đã viết một bài đánh giá ở Cox, NJ 2010. Giới hạn của độ lệch mẫu và kurtosis. Tạp chí Stata 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Tóm tắt: Độ lệch mẫu và độ nhiễu được giới hạn bởi các chức năng của cỡ mẫu. Các giới hạn, hoặc gần đúng với chúng, đã nhiều lần được khám phá lại trong nhiều thập kỷ qua, nhưng dường như vẫn chỉ được biết đến ít. Các giới hạn truyền đạt sự thiên vị cho ước tính và, trong trường hợp cực đoan, ngụ ý rằng không có mẫu nào có thể làm chứng chính xác cho phân phối chính của nó. Các kết quả chính được giải thích trong phần đánh giá hướng dẫn và nó cho thấy Stata và Mata có thể được sử dụng như thế nào để xác nhận và khám phá hậu quả của chúng.
Bây giờ đến những gì thường được coi là không phải là vấn đề:
Nhiều người dịch kurtosis là đỉnh điểm, nhưng những người khác nhấn mạnh rằng nó thường phục vụ như một thước đo trọng lượng đuôi. Trong thực tế, hai cách giải thích đều có thể là từ ngữ hợp lý cho một số phân phối. Gần như không thể tránh khỏi việc không có sự giải thích bằng lời nói đơn giản về sự kurtosis: ngôn ngữ của chúng ta không đủ phong phú để so sánh các khoản tiền của các quyền lực thứ tư về độ lệch so với trung bình và tổng của các quyền lực thứ hai như nhau.
Trong một tác phẩm kinh điển nhỏ và thường bị bỏ qua, Irving Kaplansky (1945a) đã thu hút sự chú ý đến bốn ví dụ về phân phối với các giá trị khác nhau của kurtosis và hành vi không phù hợp với một số thảo luận về kurtosis.
Tất cả các bản phân phối đều đối xứng với trung bình 0 và phương sai 1 và có các hàm mật độ, cho biến và ,xc=π−−√
(1) (1/3c)(9/4+x4)exp(−x2)
(2) (3/(c8–√))exp(−x2/2)−(1/6c)(9/4+x4)exp(−x2)
(3) (1/6c)(exp(−x2/4)+4exp(−x2))
(4) (33–√/16c)(2+x2)exp(−3x2/4)
Kurtosis (không trừ) là (1) 2,75 (2) 3.125 (3) 4.5 (4) 8/3 2.667: so sánh giá trị Gaussian hoặc giá trị bình thường là 3. Mật độ tại giá trị trung bình là (1) 0.423 (2 ) 0.387 (3) 0.470 (4) 0.366: so sánh giá trị Gaussian của 0.399.≈
Đó là hướng dẫn để âm mưu những mật độ này. Người dùng Stata có thể tải xuống kaplansky
chương trình của tôi từ SSC. Sử dụng thang đo logarit cho mật độ có thể giúp ích.
Không đưa ra các chi tiết đầy đủ, những ví dụ này làm suy yếu bất kỳ câu chuyện đơn giản nào mà mức độ tổn thương thấp hoặc cao có một sự giải thích rõ ràng về mặt đỉnh cao hoặc thực sự là bất kỳ sự tương phản nào khác.
Nếu cái tên Irving Kaplansky rung chuông, thì có khả năng là vì bạn biết công việc của ông trong đại số hiện đại. Ông (1917-2006) là một nhà toán học người Canada (sau này là người Mỹ) và giảng dạy và nghiên cứu tại Harvard, Chicago và Berkeley, với một năm thời chiến trong Nhóm Toán học Ứng dụng của Hội đồng Quốc phòng tại Đại học Columbia. Kaplansky đã đóng góp lớn cho lý thuyết nhóm, lý thuyết vòng, lý thuyết về đại số toán tử và lý thuyết trường. Ông là một nghệ sĩ dương cầm và nhà viết lời thành đạt và là một nhà triển lãm toán học nhiệt tình và sáng suốt. Cũng lưu ý một số đóng góp khác cho xác suất và thống kê của Kaplansky (1943, 1945b) và Kaplansky và Riordan (1945).
Kaplansky, I. 1943. Một đặc tính của phân phối bình thường. Biên niên sử thống kê toán học 14: 197-198.
Kaplansky, I. 1945a. Một lỗi phổ biến liên quan đến kurtosis. Tạp chí, Hiệp hội thống kê Mỹ 40: 259 thôi.
Kaplansky, I. 1945b. Sự phân phối tiệm cận của các phần tử liên tiếp. Biên niên sử thống kê toán học 16: 200-203.
Kaplansky, I. và Riordan, J. 1945. Nhiều kết hợp và chạy theo phương pháp tượng trưng. Biên niên sử thống kê toán học 16: 272-277.