Các giá trị quan trọng của Wilcoxon-Mann-Whitney trong R


10

Tôi đã nhận thấy rằng khi tôi cố gắng tìm các giá trị tới hạn cho Mann-Whitney U bằng R, các giá trị luôn là 1 + giá trị tới hạn. Ví dụ: với , giá trị tới hạn (hai đuôi) là 8, trong khi đối với , (hai đuôi ) giá trị tới hạn là 22 (kiểm tra các bảng ), nhưng:α=.05,n=10,m=5α=.05,n=12,m=8

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Tất nhiên tôi không xem xét điều gì, nhưng ... có ai có thể giải thích cho tôi tại sao không?

Câu trả lời:


17

Tôi nghĩ rằng câu trả lời ở đây có thể là bạn đang so sánh táo và cam.

Gọi biểu thị cdf của thống kê Mann - Whitneylà hàm quantile của . Theo định nghĩa, do đó, F(x)UqwilcoxQ(α)U

Q(α)=inf{xN:F(x)α},α(0,1).

Vì rời rạc nên thường không có sao cho , nên thường là .UxF(x)=αF(Q(α))>α

Bây giờ, hãy xem xét giá trị tới hạn cho thử nghiệm. Trong trường hợp này, bạn muốn , vì bạn khác sẽ có một thử nghiệm với một tỷ lệ lỗi loại I có nghĩa là lớn hơn so với cái danh nghĩa. Điều này thường được coi là không mong muốn; kiểm tra bảo thủ có xu hướng được ưa thích. Do đó, Trừ khi có một sao cho , do đó chúng ta có .C(α)F(C(α))α

C(α)=sup{xN:F(x)α},α(0,1).
xF(x)=αC(α)=Q(α)1

Lý do cho sự khác biệt là qwilcoxđã được thiết kế để tính toán lượng tử và không phải là giá trị quan trọng!


1
(+1) Mô tả hay, đơn giản, súc tích. :)
Đức hồng y

2

Hãy nhớ rằng thống kê kiểm tra tổng xếp hạng là rời rạc và do đó bạn cần sử dụng giá trị tới hạn sao cho xác suất đuôi là cho được chỉ định . Đối với một số kích thước mẫu bằng alpha không thể đạt được và đó là phỏng đoán của tôi về lý do tại sao bạn cần +1.α


4
Vậy tại sao +1 cần thiết trong R mà không phải trong các bảng thông thường?
MånsT

1
@ this.is.not.a.nick: có lẽ quan trọng hơn, trong khi , có nghĩa là trong trường hợp trước, mức ý nghĩa thực tế sẽ là và trong trường hợp sau nó sẽ . Thông thường mọi người có xu hướng thích sai ở phía bên phải, nghĩa là có mức ý nghĩa thấp hơn mức danh nghĩa (có nghĩa là các giá trị từ các bảng được ưu tiên hơn). 0.0236723<0.0250.02868937>0.025<0.05>0.05
MånsT

1
Quyền cho cả Procrastinator và MansT. Trên thực tế, mức xác định của mức ý nghĩa đòi hỏi xác suất đuôi không tính tổng bằng bất cứ thứ gì cao hơn alpha. Tôi nói về điều này trong bài báo của mình với Christine Liu về hành vi răng cưa của hàm năng lượng đối với các phép thử nhị thức chính xác thông qua phương pháp Clopper-Pearson (xem American Statistician (2002)).
Michael R. Chernick

2
@Michael: Nó ở cùng trang với trang này. Các bảng tuân theo định nghĩa chuẩn, có nghĩa là các giá trị tới hạn không phải là lượng tử.
MånsT

3
@Michael: Đồng ý. Theo một nghĩa nào đó, qwilcoxlàm những gì nó phải làm, nhưng không phải là những gì bạn mong đợi nó làm.
MånsT
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.