Giả thuyết null Mann-Whitney dưới phương sai không bằng nhau


9

Tôi chỉ tò mò về giả thuyết khống về bài kiểm tra Mann-Whitney U. Tôi thường thấy nó nói rằng giả thuyết null là hai quần thể có phân phối bằng nhau. Nhưng tôi đang nghĩ - nếu tôi có hai quần thể bình thường có cùng phương sai nhưng cực kỳ bất bình đẳng, thử nghiệm Mann-Whitney có thể sẽ không phát hiện ra sự khác biệt này.

Pr(X>Y)=0.5XY

Tôi hy vọng sẽ nhận được một chút giúp đỡ gỡ rối điều này. Cảm ơn!

Câu trả lời:


5

Thử nghiệm Mann-Whitney là trường hợp đặc biệt của thử nghiệm hoán vị (phân phối dưới giá trị được lấy bằng cách xem xét tất cả các hoán vị có thể có của dữ liệu) và các thử nghiệm hoán vị có giá trị phân phối giống hệt nhau, do đó, về mặt kỹ thuật là chính xác.

Một cách nghĩ về thống kê kiểm tra Mann-Whitney là thước đo số lần giá trị được chọn ngẫu nhiên từ một nhóm vượt quá giá trị được chọn ngẫu nhiên từ nhóm khác. Vì vậy, P (X> Y) = 0,5 cũng có ý nghĩa và về mặt kỹ thuật đây là một thuộc tính của các phân phối bằng nhau null (giả sử các phân phối liên tục trong đó xác suất hòa là 0). Nếu 2 phân phối giống nhau thì xác suất X lớn hơn Y là 0,5 vì cả hai đều được rút ra từ cùng một phân phối.

Trường hợp đã nêu của 2 phân phối có cùng phương sai nhưng khác nhau rộng rãi phù hợp với giả thuyết null thứ 2, nhưng không phải là phân phối thứ nhất giống hệt nhau. Chúng ta có thể thực hiện một số mô phỏng để xem điều gì xảy ra với các giá trị p trong trường hợp này (về lý thuyết chúng nên được phân phối đồng đều):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

Vì vậy, rõ ràng điều này đang từ chối thường xuyên hơn mức cần thiết và giả thuyết null là sai (điều này phù hợp với sự bình đẳng của các bản phân phối, nhưng không phải là prob = 0,5).

Suy nghĩ về xác suất của X> Y cũng gặp phải một số vấn đề thú vị nếu bạn từng so sánh các quần thể dựa trên súc sắc của Efron .


Xin chào Greg, cảm ơn bạn đã trả lời. Nghe có vẻ như những gì bạn đang nói là tôi đã tìm thấy phần nào trường hợp đặc biệt trong đó bài kiểm tra không hoạt động đúng theo các bản phân phối bằng nhau null. Và hơn nữa, các giả thuyết null tôi đã nêu không bằng nhau. Đúng không?
Jimj

4

Mann-Whitney không nhạy cảm với những thay đổi về phương sai với giá trị trung bình bằng nhau, nhưng nó có thể - như bạn thấy với dạng , phát hiện sự khác biệt khiến lệch khỏi (ví dụ: trong đó cả trung bình và phương sai tăng cùng nhau). Khá rõ ràng nếu bạn có hai quy tắc có giá trị trung bình bằng nhau, sự khác biệt của chúng là đối xứng về không. Do đó , đó là tình huống null.P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

Ví dụ: nếu bạn có phân phối theo cấp số nhân với trung bình trong khi có phân phối theo cấp số nhân với trung bình (thay đổi tỷ lệ), Mann-Whitney rất nhạy cảm với điều đó (thực sự, lấy nhật ký của cả hai bên, nó chỉ là một dịch chuyển vị trí và Mann-Whitney không bị ảnh hưởng bởi sự biến đổi đơn điệu).Y1Xk

-

Nếu bạn quan tâm đến các bài kiểm tra về mặt khái niệm rất giống với Mann-Whitney nhạy cảm với sự khác biệt về sự lây lan dưới sự bình đẳng của các trung vị, thì có một số bài kiểm tra như vậy.

Có những Siegel-Tukey thử nghiệm và kiểm tra Ansari-Bradley, ví dụ, cả hai đều liên quan chặt chẽ để kiểm tra mẫu Mann-Whitney-Wilcoxon hai.

Cả hai đều dựa trên ý tưởng cơ bản của xếp hạng từ cuối.

Nếu bạn sử dụng R, thử nghiệm Ansari-Bradley được tích hợp trong ... ?ansari.test

Siegel-Tukey có hiệu lực chỉ thực hiện một thử nghiệm Mann-Whitney-Wilcoxon trên các cấp bậc được tính toán từ mẫu khác nhau; nếu bạn tự xếp hạng dữ liệu, bạn thực sự không cần một hàm riêng cho các giá trị p. Tuy nhiên, bạn có thể tìm thấy một số, như ở đây:

http://www.r-statistic.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-varabilities-r-code/

-

(liên quan đến nhận xét của ttnphns dưới câu trả lời ban đầu của tôi)

Bạn sẽ diễn giải quá mức phản hồi của tôi khi đọc nó là không đồng ý với @GregSnow theo bất kỳ ý nghĩa đặc biệt quan trọng nào. Chắc chắn có một sự khác biệt trong nhấn mạnh và ở một mức độ nào đó trong những gì chúng ta đang nói, nhưng tôi rất ngạc nhiên nếu có nhiều bất đồng thực sự đằng sau nó.

Hãy quote Mann và Whitney: "Một số liệu thống kê tùy thuộc vào cấp bậc tương đối của 's và là được đề xuất để thử nghiệm giả thuyết . " Đó là rõ ràng; nó hoàn toàn hỗ trợ vị trí của @ GregSnow.Uxyf=g

Bây giờ, hãy xem cách thống kê được xây dựng: " Hãy để đếm số lần a đi trước một .Uyx " Bây giờ nếu null của chúng là đúng, xác suất của sự kiện đó là ... nhưng có nhiều cách khác để có xác suất 0,5 và theo nghĩa đó, người ta có thể hiểu rằng thử nghiệm có thể hoạt động trong các trường hợp khác. Trong phạm vi mà họ ước tính xác suất (tỷ lệ lại) mà > , nó hỗ trợ những gì tôi đã nói.12YX

Tuy nhiên, để các mức ý nghĩa được đảm bảo chính xác, bạn cần phân phối để khớp với phân phối null. Điều đó xuất phát từ giả định rằng tất cả các hoán vị của nhãn nhóm và đối với các quan sát kết hợp dưới giá trị đều có khả năng như nhau. Đây chắc chắn là trường hợp dưới . Chính xác như @GregSnow đã nói.UXYf=g

Câu hỏi là mức độ của trường hợp này (nghĩa là sự phân phối của thống kê kiểm tra khớp với kết quả xuất phát theo giả định rằng , hoặc xấp xỉ như vậy), đối với null được biểu thị chung hơn.f=g

Tôi tin rằng trong nhiều tình huống mà nó làm; đặc biệt cho các tình huống bao gồm nhưng tổng quát hơn so với trường hợp bạn mô tả (hai quần thể bình thường có cùng phương sai nhưng cực kỳ bất bình đẳng có thể được khái quát hóa khá nhiều mà không làm thay đổi phân phối kết quả dựa trên xếp hạng), tôi tin rằng phân phối thống kê kiểm tra Hóa ra có cùng một phân phối mà theo đó nó được dẫn xuất và do đó nên có giá trị ở đó. Tôi đã làm một số mô phỏng dường như hỗ trợ này. Tuy nhiên, nó sẽ không phải luôn là một thử nghiệm rất hữu ích (nó có thể có sức mạnh kém).

Tôi không cung cấp bằng chứng rằng đây là trường hợp. Tôi đã áp dụng một số đối số trực quan / lượn sóng tay và cũng đã thực hiện một số mô phỏng cơ bản cho thấy điều đó đúng - rằng Mann-Whitney hoạt động (trong đó nó có phân phối 'phải' dưới null) rộng hơn nhiều so với khi .f=g

Làm cho nó những gì bạn sẽ, nhưng tôi không hiểu đây là sự bất đồng thực sự với @GregSnow

Tham khảo - Giấy gốc của Mann & Whitney


Tôi có hiểu đúng không khi bạn đồng tình với những từ này từ trang thảo luận Mann-Whitney của Wikipedia : the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation. Và vì vậy, bạn không đồng ý với câu trả lời của @ Greg, phải không?
ttnphns

Tôi đã thêm một số thảo luận trong chỉnh sửa.
Glen_b -Reinstate Monica

Ngoài ra rất tốt đẹp. Tôi sẽ nghiên cứu nó (Tôi luôn cảm thấy như thể có những sắc thái trong bài kiểm tra MW tiếp tục trốn tránh tôi). Trong khi đó, bạn có đồng ý không nếu tôi nói: "Bởi vì thống kê kiểm tra của MW chỉ phản ánh sự bình đẳng (trong) của các cấp bậc trung bình , nên có thể có tình huống khi f ~ = g [Tôi hiểu f, g là phân phối ban đầu, xếp hạng trước] nhưng thử nghiệm hoàn toàn không liên quan vì nó tiếp tục xử lý cùng H0 như dưới f = g. Một ví dụ về tình huống đó là các phân phối đối xứng hoàn toàn giống nhau ngoại trừ tham số lây lan (phương sai) ".
ttnphns

Trong các ký hiệu (Mann và Whitney bằng cách này), và là mật độ của và . Tôi đồng ý rằng trong phạm vi mà tôi đã xác minh / hiểu các trường hợp, tuyên bố của bạn dường như là trường hợp. Tôi nghi ngờ vẫn còn nhiều điều về Mann-Whitney cũng trốn tránh tôi. fgXY
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.