Sự khác biệt giữa wilcox.test và coin :: wilcox_test trong R là gì?


13

Hai hàm này tồn tại trong R nhưng tôi không biết sự khác biệt của chúng. Có vẻ như họ chỉ trả lại cùng giá trị p khi gọi wilcox.testbằng correct=FALSEwilcox_test(trong gói tiền xu) với distribution="aymptotic". Đối với các giá trị khác, chúng trả về các giá trị p khác nhau. Ngoài ra, wilcox.testluôn luôn trả về W = 0 cho tập dữ liệu của tôi, độc lập với các cài đặt của tham số:

x = c(1, 1, 1, 3, 3, 3, 3)y = c(4, 4, 6, 7, 7, 8, 10)

Ngoài ra, khi tôi thử sử dụng các công cụ khác ngoài R (một số có sẵn trực tuyến, một số khác là tiện ích bổ sung Excel), đôi khi chúng báo cáo các giá trị p khác nhau.

Vậy làm thế nào tôi có thể biết công cụ nào đang cho giá trị p "chính xác"?

Có giá trị p "chính xác" không, hoặc nếu một vài công cụ cho giá trị p <0,05 thì tôi có nên vui không? (Đôi khi các công cụ này không cung cấp nhiều khả năng tham số như R.)

Tôi đang thiếu gì ở đây?

Câu trả lời:


18

Chìa khóa cho câu hỏi của bạn được tìm thấy trong? Wilcox.test trong phần Ghi chú:

Các tài liệu không nhất trí về các định nghĩa của tổng thứ hạng Wilcoxon và các bài kiểm tra Mann-Whitney.

Vì vậy, điều đó có nghĩa là có nhiều hơn một cách để thực hiện thử nghiệm không tham số này về sự thay đổi vị trí giữa hai mẫu. Ngoài ra, với mỗi định nghĩa, có nhiều hơn một cách để nhận giá trị ap. "Chính xác" có nghĩa là nó hoàn toàn chính xác, trong khi "gần đúng" hoặc "tiệm cận" đều là xấp xỉ của sự thật. Đó là lý do tại sao có nhiều tùy chọn trong cả hai wilcox.test()wilcox_test(), và chỉ một số trong số chúng khớp chính xác - khi bạn có cả hai chức năng thực hiện chính xác cùng một điều. Dường như wilcox_test()có thể nhận được các giá trị p chính xác ngay cả khi có các giá trị bị ràng buộc, trong khi wilcox.test()lại rơi vào một xấp xỉ tiệm cận khi có các giá trị được gắn. Tôi sẽ không biết sự kết hợp giữa tính toán thống kê và giá trị p mà một tiện ích bổ sung Excel đang thực hiện,

Câu hỏi tiếp theo của bạn là tại sao wilcox.test()trở về 0 mọi lúc. Đối với tập dữ liệu bạn đã tạo, giá trị của thống kê kiểm tra là 0 khi bạn thực hiện wilcox.test (x, y) nhưng sẽ là 49 khi bạn thực hiện wilcox.test (y, x) mặc dù giá trị p sẽ là tương tự. Xem trang wikipedia để biết lý do. wilcox_test()trả về một phép biến đổi Z của thống kê được trả về wilcox.test(), đó là lý do tại sao chúng có các giá trị khác nhau của thống kê kiểm tra.

Có một giá trị p chính xác? Có, nhưng đôi khi quá khó để tính toán, và vì vậy chúng ta cần sử dụng các phương pháp gần đúng (xem? Wilcox_test để biết mô tả về cách tính toán chính xác có thể thất bại từ bộ nhớ không đủ). Sự khác biệt giữa giá trị gần đúng và giá trị chính xác sẽ không quan trọng trừ khi sự khác biệt thực sự ở vị trí của hai nhóm là rất nhỏ.


(+1) Chào mừng đến với trang web của chúng tôi, Drew!
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.