Hiệu quả tương đối của Wilcoxon đã xếp hạng trong các mẫu nhỏ


9

Tôi đã thấy trong các tài liệu xuất bản (và được đăng trên đây) rằng hiệu quả tương đối không có triệu chứng của bài kiểm tra xếp hạng Wilcoxon đã ký ít nhất là 0,864 khi so sánh với bài kiểm tra t. Tôi cũng đã nghe nói rằng điều này chỉ áp dụng cho các mẫu lớn, mặc dù một số cuốn sách không đề cập đến điều này (cái gì với cái đó?).

Dù sao, câu hỏi của tôi là, những thứ nhỏ cần phải có được trước khi đoạn văn trên không còn áp dụng?

Trong trường hợp của tôi, tôi có 4 cặp dữ liệu. Nếu tất cả các giả định đều được giữ, tôi biết rằng tôi có ít nhất 90% sức mạnh để phát hiện kích thước hiệu ứng của 2SD theo thử nghiệm t được ghép nối nếu tôi sử dụng hệ số alpha 0,1 và có dữ liệu tương quan vừa phải. Tuy nhiên, tôi muốn sử dụng bài kiểm tra xếp hạng có chữ ký của Wilcoxon do cỡ mẫu nhỏ và không có khả năng kiểm tra các giả định nhưng tôi lo ngại bài kiểm tra sẽ có quá ít năng lượng nếu tôi làm. Cảm ơn!


4
"Không có triệu chứng" bất cứ điều gì trong "mẫu nhỏ" không có ý nghĩa: đó là một mâu thuẫn trong điều khoản. Tôi nghi ngờ bạn đang yêu cầu hiệu quả tương đối thực tế trong các mẫu nhỏ, thời gian. Câu trả lời phụ thuộc vào các bản phân phối cơ bản mà bạn đang so sánh và do đó sẽ rất phức tạp trừ khi bạn có hai bản phân phối cụ thể. Nhiều người chọn Bình thường để tham khảo, nhưng điều đó có thể không nhất thiết phù hợp với các ứng dụng của bạn.
whuber

Có, tôi đang tìm kiếm hiệu quả tương đối trong các mẫu nhỏ. Cảm ơn đã chỉ ra rằng. Tôi muốn biết điều tồi tệ nhất tôi có thể làm là khôn ngoan. Tôi thực sự không có bất kỳ phân phối cơ bản nào trong tâm trí nhưng nếu tôi sử dụng bình thường, như bạn đề xuất, tôi sẽ tiến hành như thế nào? Tôi biết rằng nó cũng sẽ phụ thuộc vào mức độ tương quan của dữ liệu.
Jimj

1
"Dữ liệu tương quan vừa phải" là gì?
Glen_b -Reinstate Monica

1
Lưu ý rằng công suất trên 90% của bạn sẽ ở mức bình thường, không phải ở mức phân phối trong đó IS là 0,864. Vì vậy, việc tính toán nên được thực hiện ở mức bình thường.
Glen_b -Reinstate Monica

@ Glen_b: Bạn nói đúng, tôi nên xác định những gì tôi đã nghĩ bằng cách tương quan vừa phải. Tôi đã nghĩ về một mối tương quan của ít nhất 0,4. Vì vậy, làm thế nào sau đó tôi sẽ làm tính toán? Ngoài ra, về câu hỏi ban đầu của tôi về việc so sánh hiệu quả của hai bài kiểm tra ở cỡ mẫu nhỏ, tôi đã nghiên cứu một chút về chủ đề này. Một vài nguồn chỉ ra rằng câu trả lời không hoàn toàn rõ ràng trong các mẫu nhỏ hơn nhưng xét nghiệm Wilcoxon thực hiện khá tốt. Có lẽ bây giờ tôi sẽ phải sống với kiểu trả lời đó.
Jimj

Câu trả lời:


11

Klotz đã xem xét sức mạnh mẫu nhỏ của bài kiểm tra xếp hạng đã ký so với một mẫu trong trường hợp bình thường.t

[Klotz, J. (1963) "Sức mạnh mẫu nhỏ và hiệu quả đối với một mẫu Wilcoxon và các xét nghiệm điểm bình thường" Biên niên sử về thống kê toán học , Tập. 34, số 2, trang 624-632]

Tại và gần (chính xác s không thể đạt được tất nhiên, trừ khi bạn đi con đường ngẫu nhiên, mà hầu hết mọi người tránh được sử dụng, và tôi nghĩ rằng với lý do) hiệu quả tương đối so với tại bình thường có xu hướng khá gần với IS ở đó (0,955), mặc dù mức độ phụ thuộc gần như thế nào (nó thay đổi theo độ dịch chuyển trung bình và ở mức nhỏ hơn , hiệu quả sẽ thấp hơn). Ở cỡ mẫu nhỏ hơn 10, hiệu quả thường cao hơn (một chút).α 0,1 α t αn=10α0.1αtα

Với và (cả hai đều có gần 0,05), hiệu quả đạt khoảng 0,97 hoặc cao hơn.n = 6 αn=5n=6α

Vì vậy, nói rộng ra ... các IS ở mức bình thường là sự đánh giá thấp về hiệu quả tương đối trong trường hợp mẫu nhỏ, miễn là không nhỏ. Tôi tin rằng đối với thử nghiệm hai đuôi với mức nhỏ nhất có thể đạt được của bạn là 0,125. Ở mức ý nghĩa chính xác và cỡ mẫu, tôi nghĩ rằng hiệu quả tương đối của sẽ cao tương tự (có lẽ vẫn ở khoảng 0,97-0,98 hoặc cao hơn) trong khu vực có sức mạnh thú vị.n = 4 α tαn=4αt

Tôi có lẽ nên quay lại và nói về cách thực hiện một mô phỏng, điều này tương đối đơn giản.

Biên tập:

Tôi vừa thực hiện một mô phỏng ở mức 0,125 (vì có thể đạt được ở cỡ mẫu này); có vẻ như - trên một loạt các khác biệt về ý nghĩa, hiệu quả điển hình thấp hơn một chút, với , nhiều hơn khoảng 0,95-0,97 hoặc tương tự - tương tự như giá trị tiệm cận.n=4


Cập nhật

Đây là sơ đồ công suất (2 mặt) cho phép thử t (được tính bằng power.t.test) trong các mẫu bình thường và công suất mô phỏng cho phép thử xếp hạng Wilcoxon đã ký - 40000 mô phỏng mỗi điểm, với phép thử t là biến thiên điều khiển. Độ không đảm bảo ở vị trí của các chấm nhỏ hơn một pixel:

đường cong sức mạnh cho t và sức mạnh cho Wilcoxon


Để làm cho câu trả lời này đầy đủ hơn, tôi thực sự nên xem xét hành vi cho trường hợp mà thực tế là IS là 0,864 (beta (2,2)).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.