Không.
Trong khi các xét nghiệm tham số có thể mạnh hơn không phải lúc nào cũng như vậy. Khi không phải như vậy thì thường là trong các tình huống bạn không nên chạy các bài kiểm tra tham số.
Nhưng, ngay cả khi bạn đang thu thập các mẫu có kích thước phù hợp từ các phân phối bình thường với phương sai bằng nhau trong đó thử nghiệm tham số có công suất cao hơn, thì không đảm bảo rằng đối với bất kỳ thử nghiệm cụ thể nào, thử nghiệm tham số không quan trọng có nghĩa là thử nghiệm không tham số không quan trọng. Đây là một mô phỏng chỉ sử dụng lấy mẫu ngẫu nhiên từ các bản phân phối bình thường và thấy rằng khoảng 1,8% thời gian khi p> 0,05 cho thử nghiệm t mà p <0,05 cho thử nghiệm Wilcoxon.
nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
tt <- t.test(y1, y2, var.equal = TRUE)
wt <- wilcox.test(y1, y2)
c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim
Bạn có thể lưu ý rằng, trong mô phỏng này, sức mạnh của phép thử tham số lớn hơn phép thử không tham số (mặc dù, chúng tương tự nhau).
sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power
Nhưng, như được trình bày ở trên, điều đó không có nghĩa là trong tất cả các trường hợp trong đó thử nghiệm tham số không tìm thấy hiệu ứng mà thử nghiệm không theo dõi cũng thất bại.
Bạn có thể chơi với mô phỏng này. Làm cho n khá lớn, giả sử 1000 và làm cho kích thước hiệu ứng nhỏ hơn nhiều, ví dụ 0,02 (bạn cần công suất thấp để có nhiều mẫu trong đó thử nghiệm thất bại). Bạn có thể được đảm bảo khá nhiều với n 1000 mà không có mẫu nào bị từ chối vì tính phi quy tắc (bằng cách kiểm tra, không phải là thử nghiệm ngu ngốc) hoặc có các ngoại lệ đáng ngờ. Tuy nhiên, một số xét nghiệm tham số không có ý nghĩa trong khi các xét nghiệm không tham số là đáng kể.
Bạn cũng có thể muốn xem Hunter & May (1993).
Hunter, MA, & May, RB (1993). Một số huyền thoại liên quan đến các xét nghiệm tham số và không tham số. Tâm lý học Canada, 34 (4), 384-389.