Là đầu ra thống kê W của wilcox.test () trong R giống như thống kê U?


22

Gần đây tôi đã đọc về bài kiểm tra Mann-Whitney U. Hóa ra để thực hiện bài kiểm tra này trong R, bạn thực sự cần phải chạy thử nghiệm Wilcoxon!

Câu hỏi của tôi: thống kê W wilcox.testtrong R có giống với thống kê U không?

Câu trả lời:


25

Wilcoxon thường được ghi nhận là người phát minh ban đầu của bài kiểm tra *, mặc dù cách tiếp cận của Mann và Whitney là một bước tiến lớn, và họ đã mở rộng các trường hợp mà thống kê được lập. Sở thích của tôi là đề cập đến thử nghiệm với tên Wilcoxon-Mann-Whitney, để nhận ra cả hai đóng góp (Mann-Whitney-Wilcoxon cũng được nhìn thấy; tôi cũng không bận tâm điều đó).

* Tuy nhiên, hình ảnh thực tế có nhiều mây hơn, với một số tác giả khác cũng đưa ra số liệu thống kê tương tự hoặc tương tự về thời điểm này hoặc trước đó, hoặc trong một số trường hợp đóng góp có liên quan chặt chẽ với thử nghiệm. Ít nhất một số tín dụng nên đi nơi khác.

Thử nghiệm Wilcoxon và thử nghiệm Mann-Whitney U tương đương (và các trợ giúp nói rằng họ) ở chỗ họ luôn từ chối các trường hợp tương tự trong cùng hoàn cảnh; nhiều nhất là số liệu thống kê kiểm tra của họ sẽ chỉ khác nhau bởi một ca (và trong một số trường hợp, chỉ có thể là thay đổi dấu hiệu).

Thử nghiệm Wilcoxon được định nghĩa theo nhiều cách trong tài liệu (và sự mơ hồ đó bắt nguồn từ bảng kê khai ban đầu của thống kê kiểm tra, hơn cả trong một khoảnh khắc), vì vậy người ta phải quan tâm đến việc thử nghiệm Wilcoxon đang được thảo luận.

Hai hình thức định nghĩa phổ biến nhất được thảo luận trong cặp bài đăng này:

Kiểm tra tổng xếp hạng Wilcoxon trong R

Các cách khác nhau để tính toán thống kê kiểm tra cho bài kiểm tra tổng xếp hạng Wilcoxon

Để giải quyết những gì, cụ thể, xảy ra trong R:

Thống kê được sử dụng bởi wilcox.testtrong R được xác định trong trợ giúp ( ?wilcox.test) và câu hỏi về mối quan hệ với thống kê Mann-Whitney U được giải thích ở đó:

Các tài liệu không nhất trí về các định nghĩa của tổng xếp hạng Wilcoxon và các bài kiểm tra Mann-Whitney

Hai định nghĩa phổ biến nhất tương ứng với tổng các cấp bậc của mẫu đầu tiên có giá trị tối thiểu được trừ hay không: trừ R và S-PLUS không, đưa ra giá trị lớn hơn m (m + 1) / 2 cho a mẫu đầu tiên của kích thước m. (Có vẻ như bài báo gốc của Wilcoxon đã sử dụng tổng số chưa được điều chỉnh của các cấp bậc nhưng các bảng tiếp theo đã trừ đi mức tối thiểu.)

Giá trị R cũng có thể được tính như số lượng của tất cả các cặp (x[i], y[j])y[j]không phải là lớn hơn x[i], định nghĩa phổ biến nhất của kiểm định Mann-Whitney.

Câu cuối cùng này hoàn toàn trả lời khía cạnh đó của câu hỏi của bạn - phiên bản W mà R đưa ra * cũng là giá trị của U.

* Tổng các cấp bậc trong mẫu 1, trừ đi giá trị nhỏ nhất có thể nhận được (tức là trừ ).n1(n1+1)2


7

Cả bài kiểm tra tổng thứ hạng Wilcoxon và bài kiểm tra Mann-Whitney đều tương đương không tham số của bài kiểm tra t độc lập . Trong một số trường hợp, phiên bản của W mà R đưa ra, cũng là valua của U. Nhưng không phải trong tất cả các trường hợp.

Khi bạn sử dụng: wilcox.test(df$var1 ~ df$var2, paired=FALSE)W đã cho giống như U. Vì vậy, bạn có thể báo cáo đó là thống kê Mann-Whitney U.

Tuy nhiên khi bạn sử dụng : wilcox.test(df$var1 ~ df$var2, paired=TRUE), bạn thực sự đang thực hiện bài kiểm tra xếp hạng có chữ ký của Wilcoxon. Bài kiểm tra xếp hạng Wilcoxon có chữ ký tương đương với bài kiểm tra t phụ thuộc .

Nguồn: "Phát hiện thống kê sử dụng R" của Andy Field (2013)


1
Một ý kiến ​​hay để chỉ ra rằng nếu bạn sử dụng đối số paired=TRUEthì đó không phải là Wilcoxon-Mann-Whitney mà là thứ hạng đã ký.
Glen_b -Reinstate Monica

1

Tuy nhiên, lưu ý rằng mã: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(sử dụng '~')

sẽ tạo ra một thống kê W khác với a: wilcox.test(df$var1, df$var2, paired=FALSE)(sử dụng ',')


Chào mừng đến với trang web, @Tilen. Đây có phải là một câu trả lời cho câu hỏi của OP, một bình luận yêu cầu làm rõ từ OP hoặc một trong những người trả lời, hoặc một câu hỏi mới của riêng bạn? Vui lòng chỉ sử dụng trường "Câu trả lời của bạn" để cung cấp câu trả lời cho câu hỏi ban đầu. Bạn sẽ có thể nhận xét bất cứ nơi nào khi danh tiếng của bạn> 50. Nếu bạn có một câu hỏi mới, nhấp vào màu xám ASK QUESTION ở đầu trang và hỏi nó ở đó, sau đó chúng tôi có thể giúp bạn đúng cách. Vì bạn là người mới ở đây, bạn có thể muốn tham quan chúng tôi , nơi có thông tin cho người dùng mới.
gung - Phục hồi Monica

Rất cám ơn @gung. Thật vậy, đó là loại câu trả lời và câu hỏi tôi đoán. Cảm ơn bạn cho lời khuyên. Tôi mong muốn là một phần của điều này.
Tilen

'Câu trả lời' chỉ dành cho câu trả lời trực tiếp cho câu hỏi. Bạn có thể chỉnh sửa điều này để làm cho nó hoàn toàn là một câu trả lời?
gung - Phục hồi Monica

Xin lỗi vì điều đó. Tôi đã chỉnh sửa nó bây giờ. Bây giờ trông nó có tốt hơn không?
Tilen

1
Không cần phải xin lỗi. Tôi nghĩ rằng câu trả lời của bạn tiềm ẩn trong những gì bạn đặt ở đây, nhưng mọi người sẽ phải đọc giữa các dòng. Bạn có thể làm cho nó rõ ràng và buộc tất cả trong một cung? Tuy nhiên, tôi không chắc điều này đúng. Để sử dụng phiên bản công thức, bạn cần một vectơ giá trị & chỉ báo nhóm. Ví dụ wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Khi tôi làm điều đó, tôi nhận được Wcả hai cách.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.