Đây là một câu hỏi tiếp theo cho những gì Frank Harrell đã viết ở đây :
Theo kinh nghiệm của tôi, cỡ mẫu yêu cầu để phân phối t chính xác thường lớn hơn cỡ mẫu trong tay. Bài kiểm tra xếp hạng có chữ ký của Wilcoxon cực kỳ hiệu quả như bạn đã nói, và nó rất mạnh mẽ, vì vậy tôi hầu như luôn thích nó hơn bài kiểm tra t
Nếu tôi hiểu chính xác - khi so sánh vị trí của hai mẫu chưa từng có, chúng tôi muốn sử dụng phép thử tổng thứ hạng Wilcoxon so với phép thử t không ghép cặp, nếu kích thước mẫu của chúng tôi nhỏ.
Có một tình huống lý thuyết nào mà chúng tôi muốn thử nghiệm tổng xếp hạng Wilcoxon hơn thử nghiệm t không ghép đôi, thậm chí kích thước mẫu của hai nhóm của chúng tôi là tương đối lớn?
Động lực của tôi cho câu hỏi này xuất phát từ việc quan sát rằng đối với một bài kiểm tra mẫu đơn, sử dụng nó cho một mẫu không quá nhỏ của phân phối bị lệch sẽ dẫn đến lỗi loại I sai:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error