Tại sao kiểm tra t và ANOVA đưa ra các giá trị p khác nhau để so sánh hai nhóm?


18

Trong bài viết Wikipedia về ANOVA , nó nói

Ở dạng đơn giản nhất, ANOVA cung cấp một bài kiểm tra thống kê về việc phương tiện của một số nhóm có bằng nhau hay không, và do đó tổng quát hóa bài kiểm tra t cho nhiều hơn hai nhóm.

Sự hiểu biết của tôi về điều này là ANOVA giống như thử nghiệm t khi nói đến so sánh hai nhóm.

Tuy nhiên, trong ví dụ đơn giản của tôi dưới đây (trong R), ANOVA và t-test cho các giá trị p tương tự nhưng hơi khác nhau. Bất cứ ai có thể giải thích tại sao?

x1=rnorm(100,mean=0,sd=1)
x2=rnorm(100,mean=0.5,sd=1)

y1=rnorm(100,mean=0,sd=10)
y2=rnorm(100,mean=0.5,sd=10)

t.test(x1,x2)$p.value  # 0.0002695961
t.test(y1,y2)$p.value  # 0.8190363

df1=as.data.frame(rbind(cbind(x=x1,type=1), cbind(x2,type=2)))
df2=as.data.frame(rbind(cbind(x=y1,type=1), cbind(y2,type=2)))

anova(lm(x~type,df1))$`Pr(>F)`[1]  # 0.0002695578
anova(lm(x~type,df2))$`Pr(>F)`[1]  # 0.8190279

Câu trả lời:


28

Theo mặc định các tham số var.equalcủa t.test()bình đẳng FALSE. Trong lm(), phần dư được cho là có phương sai không đổi. Như vậy, bằng cách thiết lập var.equal = TRUEtrong t.test(), bạn sẽ nhận được kết quả tương tự.

var.equalscho biết liệu có coi hai phương sai là bằng nhau hay không. Nếu TRUE thì phương sai gộp được sử dụng để ước tính phương sai nếu không thì xấp xỉ Welch (hoặc Satterthwaite) với mức độ tự do được sử dụng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.