Một vài năm trước, tôi đã hoàn toàn đăng ký câu trả lời của @Michael Chernick.
Tuy nhiên, gần đây tôi nhận ra rằng một số triển khai của bài kiểm tra t cực kỳ mạnh mẽ đối với sự bất bình đẳng của phương sai. Đặc biệt, trong R hàm t.test
có một tham số mặc định var.equal=FALSE
, điều đó có nghĩa là nó không chỉ đơn giản dựa vào ước tính gộp của phương sai. Thay vào đó, nó sử dụng mức độ tự do gần đúng của Welch-Satterthwaite , bù cho sự chênh lệch không đồng đều.
Hãy xem một ví dụ.
set.seed(123)
x <- rnorm(100)
y <- rnorm(100, sd=0.00001)
# x and y have 0 mean, but very different variance.
t.test(x,y)
Welch Two Sample t-test
data: x and y
t = 0.9904, df = 99, p-value = 0.3244
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.09071549 0.27152946
sample estimates:
mean of x mean of y
9.040591e-02 -1.075468e-06
Bạn có thể thấy R yêu cầu thực hiện bài kiểm tra t của Welch chứ không phải bài kiểm tra t của Student . Ở đây mức độ tự do được tuyên bố là 99, mặc dù mỗi mẫu có kích thước 100, do đó, ở đây chức năng kiểm tra mẫu đầu tiên so với giá trị cố định 0.
Bạn có thể tự xác minh rằng việc triển khai này mang lại giá trị p chính xác ( tức là đồng nhất) cho hai mẫu có phương sai rất khác nhau.
Bây giờ, đây là một thử nghiệm t hai mẫu. Kinh nghiệm của riêng tôi với ANOVA là nó nhạy cảm hơn nhiều với sự bất bình đẳng của phương sai. Trong trường hợp đó, tôi hoàn toàn đồng ý với @Michael Chernick.