Điều gì sẽ xảy ra nếu tôi sử dụng một bài kiểm tra không tham số với dữ liệu được phân phối bình thường?


8

Tôi được hỏi liệu lỗi loại I trong thử nghiệm Shapiro-Wilk có ảnh hưởng đến phân tích chính hay không và liệu thử nghiệm sai có được sử dụng hay không nếu nó có phân phối bình thường ...


@a_statistician - có thể muốn mở rộng điều đó một chút và đăng nó dưới dạng câu trả lời, vì nó là như vậy!
jbowman

Câu trả lời:


14

Trong phân tích thống kê, nếu dữ liệu của bạn tuân theo phân phối tham số, bạn nên sử dụng lợi ích của việc biết phân phối và sử dụng các phương pháp thống kê dựa trên phân phối đó.

Nhưng đôi khi chúng ta không biết phân phối biến ngẫu nhiên, vì vậy các phương pháp thống kê phi tham số đã được phát triển để nắm lấy phạm vi rộng của các phân phối trong khi hy sinh một số hiệu quả.

Cho bạn biết phân phối biến ngẫu nhiên và sử dụng phương pháp thống kê không theo tỷ lệ, thay vì phương pháp thống kê tham số dựa trên việc biết phân phối, nó sẽ không hiệu quả, tức là sức mạnh của kiểm tra sẽ giảm, sai số chuẩn sẽ tăng và khoảng tin cậy sẽ tăng rộng hơn so với phương pháp tham số.


12

Nếu dữ liệu của bạn được rút ra từ một dân số bình thường (và các giả định thông thường khác cho một thử nghiệm t thông thường được áp dụng), thì thử nghiệm sẽ hoạt động như bình thường (nó không phải là tham số, nó được cho là hoạt động). Không có kịch tính về điểm số đó.

Nếu bạn biết đủ rằng bạn tự tin khi giả định tính bình thường, bạn có thể muốn tận dụng kiến ​​thức đó, nhưng đối với nhiều bài kiểm tra, nó không giúp ích cho bạn nhiều.

Nếu bạn đang thực hiện một trong những bài kiểm tra vị trí phổ biến (bài kiểm tra xếp hạng có chữ ký của Wilcoxon, bài kiểm tra Wilcoxon-Mann-Whitney), bạn sẽ mất gần như không có gì (thông minh về sức mạnh) trong bài kiểm tra về sự thay đổi vị trí bằng cách bỏ qua tính quy tắc. [Bạn cần thêm một lần quan sát cho mỗi 21 lần quan sát để phù hợp với sức mạnh của bài kiểm tra mạnh nhất khi tất cả các giả định của nó được giữ.]

Nếu bạn đang đối phó với một số thử nghiệm khác có thể quan trọng hơn một chút (mặc dù một số có thể quan trọng thậm chí ít hơn). Một ví dụ trong đó nó tạo ra sự khác biệt lớn hơn một chút là sử dụng thử nghiệm Friedman so với thử nghiệm ANOVA tương ứng trong thiết kế khối ngẫu nhiên.


Không phải các thử nghiệm đó chỉ là thử nghiệm dịch chuyển vị trí nếu các phân phối có hình dạng giống nhau (bình thường ở đây) cùng phương sai?
Alexis

1
@Alexis Giả định theo null cho phép thử hoán vị là khả năng trao đổi (do đó việc hoán vị nhãn / dấu hiệu vv khi cần không làm thay đổi sự phân phối của thống kê); thông thường, "phân phối nhận dạng độc lập" mạnh hơn một chút được giả sử cho H0, đưa ra các tính toán mức ý nghĩa thuận tiện cho các bài kiểm tra xếp hạng. Kết hợp với một lựa chọn thay đổi vị trí (đã được chỉ định trong câu trả lời của tôi), điều này mang lại sự xác định về hình dạng và sự lây lan mà bạn đề cập. Có lẽ tôi cần viết ra đại số "thay thế vị trí" nghĩa là đại số để mọi người có thể thấy nó được bảo hiểm
Glen_b -Reinstate Monica

1
Nếu chúng tôi không sẵn sàng chỉ định thay thế vị trí (hoặc ít nhất là nói "đó là điều chúng tôi quan tâm khi thấy sức mạnh chống lại), tôi sẽ nói rằng chúng tôi không nên giữ thử nghiệm t như một cơ sở so sánh ở nơi đầu tiên, vì nó cũng sẽ bị ảnh hưởng nếu chúng ta không có sự thay thế vị trí thay đổi. Nếu chúng ta từ bỏ phần thay đổi vị trí của so sánh, cho đến khi chúng ta chỉ định một chuỗi các lựa chọn thay thế mà chúng ta quan tâm trong, chúng tôi còn lại một câu hỏi chỉ định quá ít để tính toán sức mạnh.
Glen_b -Reinstate Monica

1
@Alexis Trên thực tế, về phản xạ tôi nghĩ rằng tôi sẽ bao gồm cả một số đại số và giải thích thêm; điều quan trọng là phải rõ ràng những gì được ngụ ý bởi các tình huống đã được đưa ra trong câu hỏi và câu trả lời, thật không may là tôi không thể làm điều đó ngay bây giờ. Cảm ơn bình luận của bạn, nó làm rõ rằng tôi không giải thích đủ ở đây.
Glen_b -Reinstate Monica 11/11/18
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.