Có thể thực hiện phân tích sức mạnh cho bài kiểm tra Kruskal-Wallis và Mann-Whitney U không? Nếu có, có bất kỳ gói / hàm R nào thực hiện nó không?
Có thể thực hiện phân tích sức mạnh cho bài kiểm tra Kruskal-Wallis và Mann-Whitney U không? Nếu có, có bất kỳ gói / hàm R nào thực hiện nó không?
Câu trả lời:
Chắc chắn có thể tính toán sức mạnh.
Để cụ thể hơn - nếu bạn đưa ra các giả định đủ để có được một tình huống mà bạn có thể tính toán (theo cách nào đó) xác suất từ chối, bạn có thể tính toán sức mạnh.
Trong Wilcoxon-Mann-Whitney, nếu (ví dụ) bạn giả sử các hình dạng phân phối (đưa ra giả định về (các) hình thức phân phối) và đưa ra một số giả định về quy mô (chênh lệch) và giá trị cụ thể của các vị trí hoặc sự khác biệt ở các vị trí , bạn có thể tính toán công suất theo đại số hoặc thông qua tích hợp số; thất bại mà bạn có thể mô phỏng tỷ lệ từ chối.
Vì vậy, ví dụ: nếu chúng tôi giả định lấy mẫu từ các phân phối với chênh lệch vị trí được chỉ định (được chuẩn hóa cho thang đo chung), thì với các kích thước mẫu, chúng tôi có thể mô phỏng nhiều bộ dữ liệu thỏa mãn tất cả các điều kiện đó và do đó có được ước tính tỷ lệ loại bỏ. Vì vậy, chúng ta hãy giả sử chúng ta có hai mẫu t 5 phân phối (gia đình vị trí quy mô) với quy mô đơn vị ( σ = 1 ) - mà không mất tính tổng quát - và với sự khác biệt vị trí δ = μ 2 - μ 1 = 1 . Một lần nữa, không mất tính tổng quát, chúng ta có thể lấy μ 1 = 0. Sau đó, đối với một số kích thước quy định mẫu - (nói) - chúng ta có thể mô phỏng các quan sát và do đó sức mạnh cho rằng giá trị cụ thể của δ / σ (ví dụ 1 ). Đây là một ví dụ nhanh trong R:
n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res) # res will be logical ("TRUE" = reject); mean is rej rate
Ba mô phỏng như thế tạo ra tỷ lệ loại bỏ là 0,321, 0,321 và 0,316; sức mạnh rõ ràng nằm trong khoảng 0,32 (bạn có thể tính khoảng tin cậy từ chỉ một mô phỏng duy nhất, vì số lượng từ chối là nhị thức ). Trên thực tế tôi có xu hướng sử dụng các mô phỏng lớn hơn, nhưng nếu bạn đang mô phỏng rất nhiều khác nhau 's hoặc δ là bạn có thể không muốn đi cao hơn nhiều so với 10000 mô phỏng cho mỗi một.
Bằng cách thực hiện nó cho nhiều giá trị của dịch chuyển vị trí, bạn thậm chí có thể có được đường cong sức mạnh cho tập hợp tình huống đó khi thay đổi vị trí thay đổi nếu bạn muốn.
Trong mẫu lớn gấp đôi và n 2 sẽ như thế nào giảm một nửa σ 2 (và do đó tăng δ / σ tại một cho δ ), do đó bạn thường có thể nhận được xấp xỉ tốt tại nhiều n từ mô phỏng tại chỉ có một vài n giá trị. Tương tự, đối với các thử nghiệm một đuôi, nếu 1 -
Lưu ý rằng mặc dù các thử nghiệm này không có phân phối (đối với phân phối liên tục) dưới giá trị null, hành vi này khác nhau theo các giả định phân phối khác nhau cho các lựa chọn thay thế.
Tình huống đối với Kruskal-Wallis cũng tương tự, nhưng bạn có nhiều sự thay đổi vị trí (hoặc bất kỳ tình huống nào khác mà bạn đang xem) để chỉ định.
Biểu đồ trong câu trả lời này cho thấy so sánh đường cong công suất cho phép thử t cặp với công suất mô phỏng cho phép thử xếp hạng đã ký ở một cỡ mẫu cụ thể, qua nhiều thay đổi vị trí được tiêu chuẩn hóa để lấy mẫu từ các phân phối bình thường với mối tương quan xác định giữa các cặp. Tính toán tương tự có thể được thực hiện cho Mann-Whitney và Kruskal-Wallis.