Là thử nghiệm Shapiro Wilk W có kích thước hiệu ứng?


8

Tôi muốn tránh lạm dụng các kiểm tra tính quy phạm trong đó một cỡ mẫu đủ lớn sẽ làm nổi bật bất kỳ tính phi quy tắc nhỏ nào. Tôi muốn có thể nói rằng một bản phân phối là "đủ bình thường".

Khi dân số không bình thường, giá trị p cho thử nghiệm Shapiro - Wilk có xu hướng 0 khi kích thước mẫu tăng. Giá trị p không hữu ích trong việc quyết định xem phân phối có "đủ bình thường" hay không.

Tôi nghĩ rằng một giải pháp sẽ là đo kích thước hiệu ứng của tính phi quy tắc và từ chối bất cứ thứ gì không bình thường hơn ngưỡng.

Thử nghiệm Shapiro Wilk tạo ra một thống kê thử nghiệm W. Đây có phải là một cách để đo kích thước hiệu ứng của sự không bình thường?

Tôi đã thử nghiệm điều này ở R bằng cách thực hiện thử nghiệm shapiro wilk trên các mẫu được rút ra từ phân phối đồng đều. Số lượng mẫu dao động từ 10 đến 5000, kết quả được vẽ dưới đây. Giá trị của W không hội tụ đến một hằng số, nó không có xu hướng1. Tôi không chắc chắn nếuWthiên vị cho các mẫu nhỏ, dường như là thấp đối với các cỡ mẫu nhỏ. NếuW là một ước tính sai lệch về kích thước hiệu ứng có thể là một vấn đề nếu tôi muốn chấp nhận bất cứ điều gì theo W=0.1 là "đủ bình thường".

Hai câu hỏi của tôi là:

  1. W Một thước đo kích thước hiệu ứng của phi bình thường?

  2. W thiên vị cho cỡ mẫu nhỏ?

âm mưu

Câu trả lời:


2

Như bạn đã biết, Wlà một thống kê kiểm tra. Trong hầu hết các trường hợp (tất cả các thử nghiệm nhất quán), thống kê thử nghiệm không phải là công cụ ước tính hiệu ứng phù hợp vì thống kê phản ánh kích thước mẫu trong khi công cụ ước tính hiệu ứng phải độc lập với nó. Chỉ cần nghĩ về một thử nghiệm tiệm cận để kiểm tra số 0 có nghĩa là theo định lý giới hạn trung tâm: Phân phối gần đúng là giống nhau cho tất cản, do đó, thống kê kiểm tra chứa tất cả các thông tin về cỡ mẫu. Điều đó làm cho thống kê kiểm tra không phù hợp như ước tính hiệu ứng.

Dành cho W, nó tương tự (mặc dù phân phối gần đúng cũng phụ thuộc vào cỡ mẫu). Giới hạn dưới choWa12n(n1), Ở đâu a1 phụ thuộc vào là kỳ vọng cho thống kê đơn hàng nhỏ nhất.

Vì vậy, không, nó không có ước tính hiệu ứng phù hợp ở tất cả.

Trên thực tế, tôi nghĩ bạn vẫn chưa chắc chắn những gì bạn đang tìm kiếm vì thuật ngữ "hiệu ứng" khó hơn một chút so với trong thế giới tham số thông thường của các tham số một chiều. Ở đây, hiệu ứng thô của việc không được phân phối bình thường là vô hạn: Mỗi tập hợp con có thể đo được củaRcó thể có một xác suất khác với mô hình phân phối bình thường. Để có hiệu ứng một chiều, bạn cần phải cân nó bằng cách nào đó và nhận thức được hậu quả của các trọng lượng khác nhau đối với ứng dụng dự định của bạn. Bằng cách này, bạn sẽ quyết định xem, ví dụ như một phân phối lưỡng kim nhất định có đuôi Gaussian là bình thường hơn so với phân phối không theo phương thức nhất định có đuôi nặng. Trong thực tế giao dịch hành vi đuôi chống lại hành vi không đuôi có thể là câu hỏi phù hợp nhất để phát minh ra một hiệu ứng phù hợp.

Sau đó, nếu sẽ dễ dàng hơn nhiều để tìm một công cụ ước tính cho hiệu ứng cụ thể này.


2
Tôi không nghĩ rằng bài kiểm tra Shapiro-Wilk "nhìn vào" sự sai lệch và kurtosis như vậy; nó không dựa trên một trong hai và có thể vui vẻ từ chối các trường hợp không bình thường xảy ra có cùng độ lệch và kurtosis như bình thường (một xét nghiệm chỉ dựa trên độ lệch và kurtosis sẽ không nhạy cảm).
Glen_b -Reinstate Monica

Thật vậy, cảm ơn, tôi đã nhầm lẫn trong trí nhớ của mình những gì Shapiro và Wilk đã viết ở trang 593. Sự sai lệch và kurtosis không bình thường sẽ được phát hiện, người ta không nói rằng nonnormality sẽ không được phát hiện nếu độ lệch và kurtosis là bình thường. Hiệu quả thậm chí còn "không đối xứng" hơn.
Horst Grünbusch

Tôi không chắc chắn về lý luận của bạn. Để thử nghiệmμ=0 đối với phân phối bình thường kích thước hiệu ứng là μσ, ước tính kích thước hiệu ứng hội tụ với tăng kích thước mẫu. Thống kê kiểm tra làx¯nsmà phân kỳ cho kích thước mẫu. Chúng tôi có thể xác định lại thống kê kiểm tra làx¯svà sau đó chiếm kích thước mẫu trong tính toán giá trị p. Đó là sự hiểu biết của tôi vềW, nó hội tụ đến một giá trị duy nhất cho kích thước mẫu lớn cho thấy rằng nó độc lập với kích thước mẫu nhưng tính toán của pchiếm kích thước mẫu.
Hugh

1
Có lẽ người ta có trước tiên để xác định một hiệu ứng là gì. W là một công cụ ước tính nhất quán cho các giá trị dự kiến ​​tiệm cận của nó (điều đó làm cho nó phù hợp cho một thử nghiệm nhất quán), nhưng bản thân kỳ vọng dường như phụ thuộc vào n(Bổ đề 4). Vì vậyWkhông phải là một công cụ ước tính hiệu ứng hoặc nó bị sai lệch. Tôi giả sử một hiệu ứng được xác định trên các bản phân phối, không phải trên các cỡ mẫu và vâng, cỡ mẫu vô hạn cũng là một cỡ mẫu.
Horst Grünbusch
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.