Đối với các bài kiểm tra t, theo hầu hết các văn bản, có một giả định rằng dữ liệu dân số thường được phân phối. Tôi không thấy lý do tại sao. Không phải thử nghiệm t chỉ yêu cầu phân phối lấy mẫu của phương tiện mẫu thường được phân phối chứ không phải dân số?
Thống kê t bao gồm tỷ lệ của hai đại lượng, cả hai biến ngẫu nhiên. Nó không chỉ bao gồm một tử số.
Để thống kê t có phân phối t, bạn không chỉ cần có nghĩa là mẫu có phân phối bình thường. Bạn cũng cần:
* (giá trị của phụ thuộc vào kiểm tra - trong một mẫu chúng ta có )t d = n - 1dtd=n−1
Để ba điều đó thực sự đúng, bạn cần dữ liệu gốc được phân phối bình thường.
Nếu đó là trường hợp kiểm tra t cuối cùng chỉ yêu cầu sự bình thường trong phân phối lấy mẫu, thì dân số có thể trông giống như bất kỳ phân phối nào, phải không?
Hãy để iid như được đưa ra trong một khoảnh khắc. Để CLT giữ được dân số phải phù hợp với điều kiện ... - dân số phải có phân phối mà CLT áp dụng. Vì vậy, không, vì có phân phối dân số mà CLT không áp dụng.
Miễn là có cỡ mẫu hợp lý. Đó không phải là những gì định lý giới hạn trung tâm?
Không, CLT thực sự không nói một từ nào về "cỡ mẫu hợp lý".
Nó thực sự không nói gì về những gì xảy ra ở bất kỳ cỡ mẫu hữu hạn nào.
Tôi đang nghĩ về một phân phối cụ thể ngay bây giờ. Đó là một trong những điều mà CLT chắc chắn áp dụng. Nhưng tại , phân phối trung bình mẫu hoàn toàn không bình thường. Tuy nhiên, tôi nghi ngờ rằng bất kỳ mẫu nào trong lịch sử nhân loại đã từng có nhiều giá trị trong đó. Vậy - bên ngoài tautology - 'hợp lý ' nghĩa là gì?n=1015n
Vì vậy, bạn có vấn đề sinh đôi:
A. Hiệu ứng mà mọi người thường gán cho CLT - cách tiếp cận ngày càng gần với tính quy luật của phân phối mẫu có nghĩa là ở cỡ mẫu nhỏ / vừa - không thực sự được nêu trong CLT **.
B. "Một cái gì đó không quá xa so với bình thường trong tử số" không đủ để thống kê có phân phối t
** (Một cái gì đó giống như định lý Berry-Esseen giúp bạn giống với những gì mọi người đang thấy khi họ nhìn vào ảnh hưởng của việc tăng kích thước mẫu trong phân phối phương tiện mẫu.)
Định lý CLT và Slutsky cùng cung cấp cho bạn (miễn là tất cả các giả định của họ nắm giữ) rằng từ , việc phân phối các phương pháp thống kê t chuẩn là bình thường. Nó không nói liệu bất kỳ hữu hạn nhất định có thể là đủ cho một số mục đích.nn→∞n