Mann-Whitney không nhạy cảm với những thay đổi về phương sai với giá trị trung bình bằng nhau, nhưng nó có thể - như bạn thấy với dạng , phát hiện sự khác biệt khiến lệch khỏi (ví dụ: trong đó cả trung bình và phương sai tăng cùng nhau). Khá rõ ràng nếu bạn có hai quy tắc có giá trị trung bình bằng nhau, sự khác biệt của chúng là đối xứng về không. Do đó , đó là tình huống null.P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(X−Y>0)=12
Ví dụ: nếu bạn có phân phối theo cấp số nhân với trung bình trong khi có phân phối theo cấp số nhân với trung bình (thay đổi tỷ lệ), Mann-Whitney rất nhạy cảm với điều đó (thực sự, lấy nhật ký của cả hai bên, nó chỉ là một dịch chuyển vị trí và Mann-Whitney không bị ảnh hưởng bởi sự biến đổi đơn điệu).Y1Xk
-
Nếu bạn quan tâm đến các bài kiểm tra về mặt khái niệm rất giống với Mann-Whitney nhạy cảm với sự khác biệt về sự lây lan dưới sự bình đẳng của các trung vị, thì có một số bài kiểm tra như vậy.
Có những Siegel-Tukey thử nghiệm và kiểm tra Ansari-Bradley, ví dụ, cả hai đều liên quan chặt chẽ để kiểm tra mẫu Mann-Whitney-Wilcoxon hai.
Cả hai đều dựa trên ý tưởng cơ bản của xếp hạng từ cuối.
Nếu bạn sử dụng R, thử nghiệm Ansari-Bradley được tích hợp trong ... ?ansari.test
Siegel-Tukey có hiệu lực chỉ thực hiện một thử nghiệm Mann-Whitney-Wilcoxon trên các cấp bậc được tính toán từ mẫu khác nhau; nếu bạn tự xếp hạng dữ liệu, bạn thực sự không cần một hàm riêng cho các giá trị p. Tuy nhiên, bạn có thể tìm thấy một số, như ở đây:
http://www.r-statistic.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-varabilities-r-code/
-
(liên quan đến nhận xét của ttnphns dưới câu trả lời ban đầu của tôi)
Bạn sẽ diễn giải quá mức phản hồi của tôi khi đọc nó là không đồng ý với @GregSnow theo bất kỳ ý nghĩa đặc biệt quan trọng nào. Chắc chắn có một sự khác biệt trong nhấn mạnh và ở một mức độ nào đó trong những gì chúng ta đang nói, nhưng tôi rất ngạc nhiên nếu có nhiều bất đồng thực sự đằng sau nó.
Hãy quote Mann và Whitney: "Một số liệu thống kê tùy thuộc vào cấp bậc tương đối của 's và là được đề xuất để thử nghiệm giả thuyết . " Đó là rõ ràng; nó hoàn toàn hỗ trợ vị trí của @ GregSnow.Uxyf=g
Bây giờ, hãy xem cách thống kê được xây dựng: " Hãy để đếm số lần a đi trước một .Uyx " Bây giờ nếu null của chúng là đúng, xác suất của sự kiện đó là ... nhưng có nhiều cách khác để có xác suất 0,5 và theo nghĩa đó, người ta có thể hiểu rằng thử nghiệm có thể hoạt động trong các trường hợp khác. Trong phạm vi mà họ ước tính xác suất (tỷ lệ lại) mà > , nó hỗ trợ những gì tôi đã nói.12YX
Tuy nhiên, để các mức ý nghĩa được đảm bảo chính xác, bạn cần phân phối để khớp với phân phối null. Điều đó xuất phát từ giả định rằng tất cả các hoán vị của nhãn nhóm và đối với các quan sát kết hợp dưới giá trị đều có khả năng như nhau. Đây chắc chắn là trường hợp dưới . Chính xác như @GregSnow đã nói.UXYf=g
Câu hỏi là mức độ của trường hợp này (nghĩa là sự phân phối của thống kê kiểm tra khớp với kết quả xuất phát theo giả định rằng , hoặc xấp xỉ như vậy), đối với null được biểu thị chung hơn.f=g
Tôi tin rằng trong nhiều tình huống mà nó làm; đặc biệt cho các tình huống bao gồm nhưng tổng quát hơn so với trường hợp bạn mô tả (hai quần thể bình thường có cùng phương sai nhưng cực kỳ bất bình đẳng có thể được khái quát hóa khá nhiều mà không làm thay đổi phân phối kết quả dựa trên xếp hạng), tôi tin rằng phân phối thống kê kiểm tra Hóa ra có cùng một phân phối mà theo đó nó được dẫn xuất và do đó nên có giá trị ở đó. Tôi đã làm một số mô phỏng dường như hỗ trợ này. Tuy nhiên, nó sẽ không phải luôn là một thử nghiệm rất hữu ích (nó có thể có sức mạnh kém).
Tôi không cung cấp bằng chứng rằng đây là trường hợp. Tôi đã áp dụng một số đối số trực quan / lượn sóng tay và cũng đã thực hiện một số mô phỏng cơ bản cho thấy điều đó đúng - rằng Mann-Whitney hoạt động (trong đó nó có phân phối 'phải' dưới null) rộng hơn nhiều so với khi .f=g
Làm cho nó những gì bạn sẽ, nhưng tôi không hiểu đây là sự bất đồng thực sự với @GregSnow
Tham khảo - Giấy gốc của Mann & Whitney