Sự khác biệt giữa thử nghiệm tính chuẩn của Shapiro-Wilk và thử nghiệm về tính quy phạm Kolmogorov-Smirnov là gì? Khi nào kết quả từ hai phương pháp này sẽ khác nhau?
Sự khác biệt giữa thử nghiệm tính chuẩn của Shapiro-Wilk và thử nghiệm về tính quy phạm Kolmogorov-Smirnov là gì? Khi nào kết quả từ hai phương pháp này sẽ khác nhau?
Câu trả lời:
Bạn thậm chí không thể so sánh cả hai vì Kolmogorov-Smirnov dành cho phân phối hoàn toàn được chỉ định (vì vậy nếu bạn đang kiểm tra tính quy tắc, bạn phải chỉ định giá trị trung bình và phương sai; chúng không thể được ước tính từ dữ liệu *), trong khi Shapiro-Wilk là cho sự bình thường, với trung bình và phương sai không xác định.
* bạn cũng không thể chuẩn hóa bằng cách sử dụng các tham số ước tính và kiểm tra tiêu chuẩn thông thường; Đó thực sự là điều tương tự.
Một cách để so sánh là bổ sung cho Shapiro-Wilk một bài kiểm tra về giá trị trung bình và phương sai xác định trong bình thường (kết hợp các bài kiểm tra theo cách nào đó) hoặc bằng cách điều chỉnh các bảng KS để ước tính tham số (nhưng sau đó nó không còn phân phối nữa -miễn phí).
Có một thử nghiệm như vậy (tương đương với Kolmogorov - Smirnov với các thông số ước tính) - thử nghiệm Lilliefors; phiên bản thử nghiệm thông thường có thể được so sánh hợp lệ với Shapiro-Wilk (và thường sẽ có sức mạnh thấp hơn). Cạnh tranh hơn là thử nghiệm Anderson-Darling (cũng phải được điều chỉnh để ước tính tham số để so sánh là hợp lệ).
Đối với những gì họ kiểm tra - thử nghiệm KS (và Lilliefors) xem xét sự khác biệt lớn nhất giữa CDF theo kinh nghiệm và phân phối được chỉ định, trong khi Shapiro Wilk so sánh hiệu quả hai ước tính về phương sai; Shapiro-Francia có liên quan chặt chẽ có thể được coi là một hàm đơn điệu của mối tương quan bình phương trong một âm mưu QQ; nếu tôi nhớ lại một cách chính xác, Shapiro-Wilk cũng tính đến hiệp phương sai giữa các thống kê đơn hàng.
[Cần lưu ý rằng có nhiều bài kiểm tra về tính quy phạm có sẵn hơn những bài kiểm tra này.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- nếu giá trị p đúng như mong muốn, thì nó sẽ trông đồng nhất!
Nói ngắn gọn, thử nghiệm Shapiro-Wilk là một thử nghiệm cụ thể về tính quy phạm, trong khi phương pháp được sử dụng bởi thử nghiệm Kolmogorov-Smirnov thì tổng quát hơn, nhưng ít mạnh mẽ hơn (có nghĩa là nó bác bỏ chính xác giả thuyết null về tính quy phạm ít thường xuyên hơn). Cả hai số liệu thống kê đều lấy tính quy tắc là null và thiết lập một thống kê kiểm tra dựa trên mẫu, nhưng cách chúng làm như vậy khác với nhau theo cách làm cho chúng ít nhiều nhạy cảm hơn với các tính năng của phân phối bình thường.
Cách tính chính xác W (thống kê kiểm tra cho Shapiro-Wilk) có liên quan một chút , nhưng về mặt khái niệm, nó liên quan đến việc sắp xếp các giá trị mẫu theo kích thước và đo lường phù hợp với các phương tiện, phương sai và hiệp phương dự kiến. Theo tôi hiểu, nhiều so sánh này so với tính quy tắc, mang lại cho bài kiểm tra nhiều sức mạnh hơn bài kiểm tra Kolmogorov - Smirnov, đây là một cách mà chúng có thể khác nhau.
Ngược lại, thử nghiệm Kolmogorov - Smirnov về tính quy phạm bắt nguồn từ cách tiếp cận chung để đánh giá mức độ phù hợp bằng cách so sánh phân phối tích lũy dự kiến so với phân phối tích lũy theo kinh nghiệm, vis:
Như vậy, nó nhạy cảm ở trung tâm của phân phối, và không phải là đuôi. Tuy nhiên, KS là phép thử hội tụ, theo nghĩa là n có xu hướng vô cùng, thử nghiệm hội tụ đến câu trả lời đúng trong xác suất (tôi tin rằng Định lý Glivenko-Cantelli áp dụng ở đây, nhưng ai đó có thể sửa cho tôi). Đây là hai cách nữa trong đó hai bài kiểm tra này có thể khác nhau trong đánh giá tính quy phạm của chúng.