Nếu bất kỳ thử nghiệm tham số nào không từ chối null, thì sự thay thế không tham số của nó có làm như vậy không?


12

Nếu các thử nghiệm không tham số được giả định là có ít năng lượng hơn các lựa chọn tham số của chúng, thì điều này có nghĩa là nếu bất kỳ thử nghiệm tham số nào không từ chối null, thì phương pháp thay thế không tham số của nó cũng không từ chối null? Làm thế nào điều này có thể thay đổi nếu các giả định của thử nghiệm tham số không được đáp ứng và thử nghiệm được sử dụng bằng cách nào?


4
(a) nếu thử nghiệm A có công suất thấp hơn thử nghiệm B trong một số trường hợp giả định, điều đó không có nghĩa là các trường hợp mà A sẽ từ chối là một tập hợp con của B (thực tế là không thể ở mức ý nghĩa cố định); họ từ chối các phần khác nhau (nhưng có lẽ chồng chéo rất nhiều) của không gian mẫu - luôn có trường hợp mỗi trường hợp sẽ từ chối rằng phần kia sẽ không. (b) Nếu các giả định của bài kiểm tra tham số không được đáp ứng (? được họ bao giờ thực sự đáp ứng), sau đó kiểm tra tham số có thể có sức mạnh tương đối nghèo (ví dụ như t-test vs Mann-Whitney dưới đuôi nặng)
Glen_b -Reinstate Monica

Câu trả lời:


9

Nếu một thử nghiệm tham số không từ chối giả thuyết null thì tương đương không tham số của nó chắc chắn vẫn có thể bác bỏ giả thuyết null. Giống như @John đã nói, điều này thường xảy ra khi các giả định sẽ đảm bảo sử dụng thử nghiệm tham số bị vi phạm. Ví dụ: nếu chúng ta so sánh thử nghiệm t hai mẫu với thử nghiệm tổng thứ hạng Wilcoxon thì chúng ta có thể xảy ra tình huống này nếu chúng ta bao gồm các ngoại lệ trong dữ liệu của mình (với các ngoại lệ chúng ta không nên sử dụng hai thử nghiệm mẫu).

#Test Data
x = c(-100,-100,rnorm(1000,0.5,1),100,100)
y = rnorm(1000,0.6,1)

#Two-Sample t-Test
t.test(x,y,var.equal=TRUE)

#Wilcoxon Rank Sum Test
wilcox.test(x,y)

Kết quả chạy thử nghiệm:

> t.test(x,y,var.equal=TRUE)

    Two Sample t-test

data:  x and y 
t = -1.0178, df = 2002, p-value = 0.3089
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6093287  0.1929563 
sample estimates:
mean of x mean of y 
0.4295556 0.6377417 

> 
> wilcox.test(x,y)

    Wilcoxon rank sum test with continuity correction

data:  x and y 
W = 443175, p-value = 5.578e-06
alternative hypothesis: true location shift is not equal to 0 

9

Không.

Trong khi các xét nghiệm tham số có thể mạnh hơn không phải lúc nào cũng như vậy. Khi không phải như vậy thì thường là trong các tình huống bạn không nên chạy các bài kiểm tra tham số.

Nhưng, ngay cả khi bạn đang thu thập các mẫu có kích thước phù hợp từ các phân phối bình thường với phương sai bằng nhau trong đó thử nghiệm tham số có công suất cao hơn, thì không đảm bảo rằng đối với bất kỳ thử nghiệm cụ thể nào, thử nghiệm tham số không quan trọng có nghĩa là thử nghiệm không tham số không quan trọng. Đây là một mô phỏng chỉ sử dụng lấy mẫu ngẫu nhiên từ các bản phân phối bình thường và thấy rằng khoảng 1,8% thời gian khi p> 0,05 cho thử nghiệm t mà p <0,05 cho thử nghiệm Wilcoxon.

nsim <- 10000
n <- 50
cohensD <- 0.2
Y <- replicate(nsim, {
    y1 <- rnorm(n, 0, 1); y2 <- rnorm(n, cohensD, 1)
    tt <- t.test(y1, y2, var.equal = TRUE)
    wt <- wilcox.test(y1, y2)
    c(tt$p.value, wt$p.value)})
sum(Y[1,] > 0.05 & Y[2,] < 0.05) / nsim

Bạn có thể lưu ý rằng, trong mô phỏng này, sức mạnh của phép thử tham số lớn hơn phép thử không tham số (mặc dù, chúng tương tự nhau).

sum(Y[1,] < 0.05) / nsim #t-test power
sum(Y[2,] < 0.05) / nsim #wilcox.test power

Nhưng, như được trình bày ở trên, điều đó không có nghĩa là trong tất cả các trường hợp trong đó thử nghiệm tham số không tìm thấy hiệu ứng mà thử nghiệm không theo dõi cũng thất bại.

Bạn có thể chơi với mô phỏng này. Làm cho n khá lớn, giả sử 1000 và làm cho kích thước hiệu ứng nhỏ hơn nhiều, ví dụ 0,02 (bạn cần công suất thấp để có nhiều mẫu trong đó thử nghiệm thất bại). Bạn có thể được đảm bảo khá nhiều với n 1000 mà không có mẫu nào bị từ chối vì tính phi quy tắc (bằng cách kiểm tra, không phải là thử nghiệm ngu ngốc) hoặc có các ngoại lệ đáng ngờ. Tuy nhiên, một số xét nghiệm tham số không có ý nghĩa trong khi các xét nghiệm không tham số là đáng kể.

Bạn cũng có thể muốn xem Hunter & May (1993).

Hunter, MA, & May, RB (1993). Một số huyền thoại liên quan đến các xét nghiệm tham số và không tham số. Tâm lý học Canada, 34 (4), 384-389.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.