Giả định tính chuẩn của một bài kiểm tra t
Hãy xem xét một dân số lớn mà từ đó bạn có thể lấy nhiều mẫu khác nhau có kích thước cụ thể. (Trong một nghiên cứu cụ thể, bạn thường chỉ thu thập một trong những mẫu này.)
Thử nghiệm t giả định rằng phương tiện của các mẫu khác nhau thường được phân phối; nó không cho rằng dân số được phân phối bình thường.
Theo định lý giới hạn trung tâm, phương tiện của các mẫu từ một quần thể có phương sai hữu hạn tiếp cận một phân phối bình thường bất kể sự phân bố của dân số. Quy tắc ngón tay cái nói rằng phương tiện mẫu về cơ bản được phân phối miễn là cỡ mẫu ít nhất là 20 hoặc 30. Để thử nghiệm t có hiệu lực trên mẫu có kích thước nhỏ hơn, phân bố dân số sẽ phải xấp xỉ bình thường.
Thử nghiệm t không hợp lệ đối với các mẫu nhỏ từ các phân phối không bình thường, nhưng nó hợp lệ đối với các mẫu lớn từ các phân phối không bình thường.
Mẫu nhỏ từ phân phối không bình thường
Như Michael lưu ý dưới đây, cỡ mẫu cần thiết cho việc phân phối phương tiện theo mức độ gần đúng phụ thuộc vào mức độ không quy tắc của dân số. Đối với các bản phân phối bình thường, bạn sẽ không cần mẫu lớn như phân phối rất không bình thường.
Dưới đây là một số mô phỏng bạn có thể chạy trong R để cảm nhận điều này. Đầu tiên, đây là một vài phân phối dân số.
curve(dnorm,xlim=c(-4,4)) #Normal
curve(dchisq(x,df=1),xlim=c(0,30)) #Chi-square with 1 degree of freedom
Tiếp theo là một số mô phỏng mẫu từ phân bố dân số. Trong mỗi dòng này, "10" là cỡ mẫu, "100" là số lượng mẫu và hàm sau đó chỉ định phân bố dân số. Họ sản xuất biểu đồ của các phương tiện mẫu.
hist(colMeans(sapply(rep(10,100),rnorm)),xlab='Sample mean',main='')
hist(colMeans(sapply(rep(10,100),rchisq,df=1)),xlab='Sample mean',main='')
Để kiểm tra t có hiệu lực, các biểu đồ này phải bình thường.
require(car)
qqp(colMeans(sapply(rep(10,100),rnorm)),xlab='Sample mean',main='')
qqp(colMeans(sapply(rep(10,100),rchisq,df=1)),xlab='Sample mean',main='')
Tiện ích của một bài kiểm tra t
Tôi phải lưu ý rằng tất cả những kiến thức tôi vừa truyền đạt có phần lỗi thời; bây giờ chúng tôi có máy tính, chúng tôi có thể làm tốt hơn kiểm tra t. Như Frank lưu ý, có lẽ bạn muốn sử dụng các bài kiểm tra Wilcoxon ở bất cứ nơi nào bạn được dạy để chạy thử nghiệm t.