Klotz đã xem xét sức mạnh mẫu nhỏ của bài kiểm tra xếp hạng đã ký so với một mẫu trong trường hợp bình thường.t
[Klotz, J. (1963) "Sức mạnh mẫu nhỏ và hiệu quả đối với một mẫu Wilcoxon và các xét nghiệm điểm bình thường" Biên niên sử về thống kê toán học , Tập. 34, số 2, trang 624-632]
Tại và gần (chính xác s không thể đạt được tất nhiên, trừ khi bạn đi con đường ngẫu nhiên, mà hầu hết mọi người tránh được sử dụng, và tôi nghĩ rằng với lý do) hiệu quả tương đối so với tại bình thường có xu hướng khá gần với IS ở đó (0,955), mặc dù mức độ phụ thuộc gần như thế nào (nó thay đổi theo độ dịch chuyển trung bình và ở mức nhỏ hơn , hiệu quả sẽ thấp hơn). Ở cỡ mẫu nhỏ hơn 10, hiệu quả thường cao hơn (một chút).α 0,1 α t αn = 10α0,1αtα
Với và (cả hai đều có gần 0,05), hiệu quả đạt khoảng 0,97 hoặc cao hơn.n = 6 αn=5n=6α
Vì vậy, nói rộng ra ... các IS ở mức bình thường là sự đánh giá thấp về hiệu quả tương đối trong trường hợp mẫu nhỏ, miễn là không nhỏ. Tôi tin rằng đối với thử nghiệm hai đuôi với mức nhỏ nhất có thể đạt được của bạn là 0,125. Ở mức ý nghĩa chính xác và cỡ mẫu, tôi nghĩ rằng hiệu quả tương đối của sẽ cao tương tự (có lẽ vẫn ở khoảng 0,97-0,98 hoặc cao hơn) trong khu vực có sức mạnh thú vị.n = 4 α tαn=4αt
Tôi có lẽ nên quay lại và nói về cách thực hiện một mô phỏng, điều này tương đối đơn giản.
Biên tập:
Tôi vừa thực hiện một mô phỏng ở mức 0,125 (vì có thể đạt được ở cỡ mẫu này); có vẻ như - trên một loạt các khác biệt về ý nghĩa, hiệu quả điển hình thấp hơn một chút, với , nhiều hơn khoảng 0,95-0,97 hoặc tương tự - tương tự như giá trị tiệm cận.n=4
Cập nhật
Đây là sơ đồ công suất (2 mặt) cho phép thử t (được tính bằng power.t.test
) trong các mẫu bình thường và công suất mô phỏng cho phép thử xếp hạng Wilcoxon đã ký - 40000 mô phỏng mỗi điểm, với phép thử t là biến thiên điều khiển. Độ không đảm bảo ở vị trí của các chấm nhỏ hơn một pixel:
Để làm cho câu trả lời này đầy đủ hơn, tôi thực sự nên xem xét hành vi cho trường hợp mà thực tế là IS là 0,864 (beta (2,2)).