Ước tính mạnh mẽ của kurtosis?


11

Tôi đang sử dụng các ước lượng thông thường cho , nhưng tôi nhận thấy rằng 'kẻ xuất' thậm chí nhỏ trong phân phối thực nghiệm của tôi, tức là đỉnh núi nhỏ xa trung tâm, ảnh hưởng đến nó rất nhiều. Có một ước tính kurtosis mạnh mẽ hơn?

K^=μ^4σ^4

Câu trả lời:


8

Có một số. Bạn sẽ tìm thấy một so sánh toàn diện trong liên kết này với một phiên bản chưa hoàn chỉnh của bài báo (tham khảo thích hợp ở cuối câu trả lời này).

Do các hạn chế của vấn đề, sự cố mạnh mẽ nhất trong số các thuật toán này (L / RMC) nhiều nhất là 12,5%. Một lợi thế của L / RMC là nó dựa trên các lượng tử và vẫn có thể hiểu được ngay cả khi phân phối cơ bản không có khoảnh khắc. Một ưu điểm khác là nó không giả định tính đối xứng của phân bố phần không bị nhiễm của dữ liệu để đo trọng lượng đuôi: trên thực tế, thuật toán trả về hai số: RMC cho trọng lượng đuôi phải và LMC cho trọng lượng đuôi trái.

[0,1]bằng cách xây dựng: ví dụ, không có lượng ô nhiễm nào có thể khiến thuật toán trả về -1!). Trong thực tế, người ta thấy rằng người ta có thể thay thế khoảng 5% mẫu bằng các ngoại lệ rất bệnh lý mà không gây ra ảnh hưởng lớn nhất của các ước tính (luôn có hai) để rời quá nhiều so với giá trị mà nó có trên mẫu không bị nhiễm bẩn.

L / RMC cũng được thực hiện rộng rãi. Ví dụ, bạn có thể tìm thấy một triển khai R ở đây . Như đã giải thích trong bài viết được liên kết ở trên, để tính L / RMC, bạn cần tính toán MC (công cụ ước tính được thực hiện trong liên kết) một cách riêng biệt ở nửa bên trái và bên phải dữ liệu của bạn. Ở đây, (trái) nửa bên phải là các mẫu phụ được hình thành từ quan sát (nhỏ hơn) lớn hơn trung bình của mẫu ban đầu của bạn.

  • Brys, Hubert, Struyf. (2006). Các biện pháp mạnh mẽ của trọng lượng đuôi.

2
Không phải các biện pháp thay thế này của trọng lượng đuôi chứ không phải là ước tính mạnh mẽ của kurtosis mỗi lần nói? Đây có thể là những gì anh ấy thực sự muốn. nhưng nó không chính xác những gì anh ấy yêu cầu. Có bất kỳ / tất cả các công cụ ước tính này hội tụ đến kurtosis cho các mẫu lớn?
andrewH

Tóm tắt từ bài báo: Tại dữ liệu không bị ô nhiễm làm bão hòa các điều kiện về thứ tự lồi của Van Zwet (theo đó biện pháp kurtosis có ý nghĩa) chúng hội tụ đến một chức năng đơn điệu của kurtosis.
user603

1
Kurtosis của Pearson đo các ngoại lệ (quan sát cực kỳ hiếm), đơn giản và đơn giản. Vì vậy, những gì bạn đang tìm kiếm thay thế? Một thước đo của "đỉnh cao"? Đầu tiên, đó không phải là tất cả những gì biện pháp kurtosis của Pearson. Thứ hai, nếu bạn muốn một thước đo "đỉnh cao", trước tiên bạn phải xác định điều đó có nghĩa là gì. Nếu bạn có thể định nghĩa nó, bạn có thể ước tính nó. Một khả năng là đạo hàm thứ hai của pdf của dữ liệu được tiêu chuẩn hóa, được đánh giá ở mức cao nhất. (Không có gì). Tôi chắc chắn có những người khác.
Peter Westfall

1
Trên thực tế, tôi đưa ra ba định lý toán học liên quan đến kurtosis với các đuôi của phân phối, vì vậy chúng không thể bị làm sai lệch: (i) Đối với tất cả các phân phối với khoảnh khắc thứ tư hữu hạn, kurtosis nằm giữa E (Z ^ 4 * I (| Z |> 1 )) và E (Z ^ 4 * I (| Z |> 1)) +1. (ii) Trong lớp con có mật độ Z ^ 2 liên tục và giảm dần (0,1), "+1" có thể được thay thế bằng "+.5". (iii) Đối với bất kỳ chuỗi phân phối nào có kurtosis -> vô cùng, E (Z ^ 4 * I (| Z |> b)) / kurtosis -> 1, cho bất kỳ b thực tế nào. Tất cả đều ở đây: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.