Tôi sẽ để lại đoạn này để các ý kiến có ý nghĩa: Có lẽ giả định về tính quy tắc trong các quần thể ban đầu là quá hạn chế và có thể được bỏ qua tập trung vào phân phối mẫu và nhờ vào định lý giới hạn trung tâm, đặc biệt là đối với các mẫu lớn.
t
Như bạn đã đề cập, phân phối t không hội tụ đến phân phối bình thường khi mẫu tăng lên, vì biểu đồ R nhanh này thể hiện:
t
Vì vậy, áp dụng thử nghiệm z có thể sẽ ổn với các mẫu lớn.
Giải quyết các vấn đề với câu trả lời ban đầu của tôi. Cảm ơn bạn, Glen_b vì sự giúp đỡ của bạn với OP (những lỗi mới có thể xảy ra trong diễn giải hoàn toàn thuộc về tôi).
- CÁC TÌNH TRẠNG TUYỆT VỜI TẠI PHÂN PHỐI THEO ĐÁNH GIÁ BÌNH THƯỜNG:
Bỏ qua sự phức tạp trong các công thức cho một mẫu hai mẫu (ghép đôi và không ghép cặp), thống kê t chung tập trung vào trường hợp so sánh trung bình mẫu với trung bình dân số là:
t-test=X¯−μsn√=X¯−μσ/n√s2σ2−−−√=X¯−μσ/n−−√∑nx=1(X−X¯)2n−1σ2−−−−−−−−√(1)
Xμσ2
- (1) ∼N(1,0)
- (1)s2/σ2n−1∼1n−1χ2n−1(n−1)s2/σ2∼χ2n−1
- Tử số và mẫu số phải độc lập.
t-statistic∼t(df=n−1)
- Định lý giới hạn trung tâm:
Xu hướng về tính quy tắc của phân phối mẫu của mẫu có nghĩa là khi kích thước mẫu tăng có thể biện minh cho việc phân phối tử số bình thường ngay cả khi dân số không bình thường. Tuy nhiên, nó không ảnh hưởng đến hai điều kiện còn lại (phân phối bình phương của mẫu số và tính độc lập của tử số với mẫu số).
Nhưng không phải tất cả đã mất, trong bài viết này, người ta đã thảo luận về cách định lý Slutzky hỗ trợ sự hội tụ tiệm cận đối với phân phối bình thường ngay cả khi phân phối chi của mẫu số không được đáp ứng.
- ROBUSTNESS:
Trên bài báo "Một cái nhìn thực tế hơn về tính mạnh mẽ và lỗi loại II của thử nghiệm để khởi hành từ quy tắc dân số" của Sawilowsky SS và Blair RC trong Bản tin tâm lý, 1992, Tập. 111, Số 2, 352-360 , trong đó họ đã thử nghiệm các bản phân phối ít lý tưởng hơn hoặc "thế giới thực" (ít bình thường hơn) cho các lỗi và loại I, có thể tìm thấy các xác nhận sau: "Mặc dù bản chất bảo thủ liên quan đến Loại Tôi có lỗi trong thử nghiệm t đối với một số phân phối thực tế này, có rất ít ảnh hưởng đến mức năng lượng đối với sự đa dạng của các điều kiện xử lý và cỡ mẫu nghiên cứu. Các nhà nghiên cứu có thể dễ dàng bù đắp tổn thất năng lượng nhẹ bằng cách chọn cỡ mẫu lớn hơn một chút " .
" Quan điểm phổ biến dường như là thử nghiệm mẫu độc lập t mạnh mẽ một cách hợp lý, trong trường hợp có liên quan đến lỗi Loại I, đối với hình dạng dân số không phải là Gaussian miễn là (a) cỡ mẫu bằng hoặc gần như vậy, (b) mẫu kích thước khá lớn (Boneau, 1960, đề cập đến cỡ mẫu từ 25 đến 30) và (c) thử nghiệm có hai đầu thay vì một đầu. Lưu ý rằng khi các điều kiện này được đáp ứng và sự khác biệt giữa alpha danh nghĩa và alpha thực tế xảy ra, sự khác biệt thường là của một người bảo thủ hơn là bản chất tự do. "
Các tác giả nhấn mạnh các khía cạnh gây tranh cãi của chủ đề này, và tôi mong muốn được làm việc trên một số mô phỏng dựa trên phân phối logic bất thường như được đề cập bởi Giáo sư Mitchell. Tôi cũng muốn đưa ra một số so sánh Monte Carlo với các phương pháp không tham số (ví dụ: thử nghiệm MannTHER Whitney U). Vì vậy, đây là một công việc đang tiến triển ...
Mô phỏng:
Tuyên bố miễn trừ trách nhiệm: Điều gì sau đây là một trong những bài tập này trong việc "chứng minh bản thân" bằng cách này hay cách khác. Các kết quả không thể được sử dụng để thực hiện khái quát hóa (ít nhất là không phải bởi tôi), nhưng tôi đoán tôi có thể nói rằng hai mô phỏng MC (có thể không hoàn hảo) này dường như không quá nản lòng khi sử dụng thử nghiệm t trong các trường hợp mô tả.
Lỗi loại I:
n=50μ=0σ=1
5%4.5%
Trong thực tế, biểu đồ mật độ của các thử nghiệm t thu được dường như trùng lặp với pdf thực tế của phân phối t:
Phần thú vị nhất là nhìn vào "mẫu số" của bài kiểm tra t, phần được cho là tuân theo phân phối chi bình phương:
(n−1)s2/σ2=98(49(SD2A+SD2A))/98(eσ2−1)e2μ+σ2
Ở đây chúng tôi đang sử dụng độ lệch chuẩn chung, như trong mục Wikipedia này :
SX1X2=(n1−1)S2X1+(n2−1)S2X2n1+n2−2−−−−−−−−−−−−−−−−−−−−−−√
Và thật ngạc nhiên (hoặc không) cốt truyện cực kỳ không giống với pdf chi bình phương chồng chất:
Lỗi loại II và nguồn:
109
5%0.024%99%
Mã ở đây .