Cho đến nay, tôi đã sử dụng thống kê Shapiro-Wilk để kiểm tra các giả định về tính quy tắc trong các mẫu nhỏ.
Bạn có thể vui lòng giới thiệu một kỹ thuật khác?
Cho đến nay, tôi đã sử dụng thống kê Shapiro-Wilk để kiểm tra các giả định về tính quy tắc trong các mẫu nhỏ.
Bạn có thể vui lòng giới thiệu một kỹ thuật khác?
Câu trả lời:
Các fBasics gói vào R (một phần của Rmetrics ) bao gồm một số xét nghiệm bình thường , bao gồm rất nhiều các phổ biến kiểm tra frequentist - Kolmogorov-Smirnov, Shapiro-Wilk, Jarque-Bera, và D'Agostino - cùng với một wrapper cho các bài kiểm tra bình thường trong gói hàng cuối - AndersonTHER Darling, CramerTHER von Mises, Lilliefors (Kolmogorov-Smirnov), Pearson chi đấm vuông, và Shapiro cảm Francia. Các tài liệu gói cũng cung cấp tất cả các tài liệu tham khảo quan trọng. Dưới đây là bản demo cho thấy cách sử dụng các bài kiểm tra từ nortest .
Một cách tiếp cận, nếu bạn có thời gian, là sử dụng nhiều hơn một thử nghiệm và kiểm tra thỏa thuận. Các thử nghiệm khác nhau theo một số cách, do đó, không hoàn toàn đơn giản để chọn "tốt nhất". Những nhà nghiên cứu khác trong lĩnh vực của bạn sử dụng những gì? Điều này có thể khác nhau và tốt nhất là nên tuân thủ các phương pháp được chấp nhận để những người khác sẽ chấp nhận công việc của bạn. Tôi thường xuyên sử dụng thử nghiệm Jarque-Bera, một phần vì lý do đó và Anderson Hampshire Darling để so sánh.
Bạn có thể xem "So sánh các thử nghiệm về tính quy phạm đơn biến" (Seier 2002) và "So sánh các thử nghiệm khác nhau về tính quy tắc" (Yazici; Yolacan 2007) để so sánh và thảo luận về các vấn đề.
Việc kiểm tra các phương thức này để so sánh trong R cũng là chuyện nhỏ, nhờ tất cả các hàm phân phối . Đây là một ví dụ đơn giản với dữ liệu mô phỏng (tôi sẽ không in ra kết quả để tiết kiệm dung lượng), mặc dù sẽ cần một giải trình đầy đủ hơn:
library(fBasics); library(ggplot2)
set.seed(1)
# normal distribution
x1 <- rnorm(1e+06)
x1.samp <- sample(x1, 200)
qplot(x1.samp, geom="histogram")
jbTest(x1.samp)
adTest(x1.samp)
# cauchy distribution
x2 <- rcauchy(1e+06)
x2.samp <- sample(x2, 200)
qplot(x2.samp, geom="histogram")
jbTest(x2.samp)
adTest(x2.samp)
Khi bạn có kết quả từ các thử nghiệm khác nhau qua các bản phân phối khác nhau, bạn có thể so sánh loại nào hiệu quả nhất. Chẳng hạn, giá trị p cho phép thử Jarque-Bera ở trên đã trả về 0,276 cho phân phối bình thường (chấp nhận) và <2.2e-16 cho phép rút gọn (từ chối giả thuyết null).
Về tính quy phạm, Shapiro-Wilk thực tế có sức mạnh tốt trong các mẫu khá nhỏ.
Đối thủ cạnh tranh chính trong các nghiên cứu mà tôi đã thấy là Anderson-Darling nói chung, hoạt động khá tốt, nhưng tôi sẽ không nói nó tốt hơn. Nếu bạn có thể làm rõ những gì thay thế bạn quan tâm, có thể một thống kê tốt hơn sẽ rõ ràng hơn. [chỉnh sửa: nếu bạn ước tính các tham số, kiểm tra AD sẽ được điều chỉnh cho điều đó.]
[Tôi thực sự khuyên bạn không nên xem xét Jarque-Bera trong các mẫu nhỏ (có lẽ được biết đến nhiều hơn với tên Bowman-Shenton trong giới thống kê - họ đã nghiên cứu phân phối mẫu nhỏ). Phân phối khớp không triệu chứng của xiên và kurtosis không giống như phân phối mẫu nhỏ - giống như cách một quả chuối không giống như một quả cam. Nó cũng có sức mạnh rất thấp so với một số lựa chọn thay thế thú vị - ví dụ như nó có sức mạnh thấp để thu được phân phối lưỡng kim đối xứng có độ nhiễu gần với phân phối bình thường.]
Mọi người thường kiểm tra mức độ phù hợp của những lý do không phải là lý do đặc biệt tốt hoặc họ đang trả lời một câu hỏi khác với câu hỏi mà họ thực sự muốn trả lời.
Ví dụ, bạn gần như chắc chắn đã biết dữ liệu của mình không thực sự bình thường (không chính xác), vì vậy không có lý do gì để cố gắng trả lời một câu hỏi mà bạn biết câu trả lời - và dù sao thì bài kiểm tra giả thuyết không thực sự trả lời .
Cho bạn biết rằng bạn chưa có tính quy phạm chính xác, bài kiểm tra giả thuyết về tính quy phạm của bạn thực sự cho bạn câu trả lời cho câu hỏi gần hơn "là cỡ mẫu của tôi đủ lớn để nhận số lượng không bình thường mà tôi có", trong khi câu hỏi thực sự mà bạn quan tâm khi trả lời thường gần hơn với " tác động của tính phi quy tắc này đối với những điều khác mà tôi quan tâm là gì?". Kiểm tra giả thuyết là đo kích thước mẫu, trong khi câu hỏi bạn muốn trả lời không phụ thuộc nhiều vào kích thước mẫu.
Có những lúc việc kiểm tra tính quy phạm có ý nghĩa gì đó, nhưng những tình huống đó hầu như không bao giờ xảy ra với các mẫu nhỏ.
Tại sao bạn kiểm tra tính bình thường?
Có toàn bộ danh mục Wikipedia về các bài kiểm tra quy phạm bao gồm:
Tôi nghĩ rằng AD có lẽ là tốt nhất của họ.
Để hoàn thiện, các nhà kinh tế lượng cũng thích thử nghiệm Kiefer và Salmon từ bài báo năm 1983 của họ trong tờ Letters Letters - nó tổng hợp các biểu hiện 'lệch chuẩn hóa' và xiên mà sau đó được phân phối vuông góc. Tôi có một phiên bản C ++ cũ mà tôi đã viết khi còn học lớp tôi có thể dịch sang R.
Chỉnh sửa: Và đây là bài báo gần đây của Bierens (re-) bắt nguồn từ Jarque-Bera và Kiefer-Salmon.
Chỉnh sửa 2: Tôi đã xem qua mã cũ và có vẻ như đó thực sự là thử nghiệm tương tự giữa Jarque-Bera và Kiefer-Salmon.
Trên thực tế, xét nghiệm Kiefer Salmon và thử nghiệm Jarque Bera rất khác nhau như được trình bày ở một số nơi nhưng gần đây nhất ở đây - Các thử nghiệm về phân phối lỗi chuẩn hóa: Phương pháp tiếp cận mạnh mẽ đơn giản của Yi-Ting Chen. Thử nghiệm Kiefer Salmon bằng cách xây dựng rất mạnh mẽ khi đối mặt với các cấu trúc lỗi loại ARCH không giống như thử nghiệm Jarque Bera tiêu chuẩn. Bài báo của Yi-Ting Chen phát triển và thảo luận về những gì tôi nghĩ có khả năng là bài kiểm tra tốt nhất vào lúc này.
Đối với cỡ mẫu <30 đối tượng, Shapiro-Wilk được coi là có sức mạnh mạnh mẽ - Hãy cẩn thận , khi điều chỉnh mức ý nghĩa của thử nghiệm, vì nó có thể gây ra lỗi loại II! [1]