Một số sách nêu một cỡ mẫu kích thước 30 hoặc cao hơn là cần thiết cho việc giới hạn trung tâm lý để đưa ra một xấp xỉ tốt cho .X¯
Quy tắc chung này là khá nhiều hoàn toàn vô dụng. Có các phân phối không bình thường trong đó n = 2 sẽ hoạt động tốt và các phân phối không bình thường mà lớn hơn không đủ - vì vậy không có giới hạn rõ ràng về các trường hợp, quy tắc này gây hiểu nhầm. Trong mọi trường hợp, ngay cả khi đó là sự thật, n yêu cầu sẽ thay đổi tùy thuộc vào những gì bạn đang làm. Thường thì bạn nhận được xấp xỉ tốt gần trung tâm phân phối ở n nhỏ , nhưng cần n lớn hơn nhiều để có được xấp xỉ khá ở đuôi.nnnn
Chỉnh sửa: Xem câu trả lời cho câu hỏi này để biết nhiều ý kiến nhưng rõ ràng nhất trí về vấn đề đó và một số liên kết tốt. Tôi sẽ không chuyển dạ mặc dù, vì bạn đã hiểu rõ về nó.
Tôi muốn xem một số ví dụ về phân phối trong đó ngay cả với cỡ mẫu lớn (có thể 100 hoặc 1000 hoặc cao hơn), phân phối của trung bình mẫu vẫn bị sai lệch.
Các ví dụ tương đối dễ xây dựng; một cách dễ dàng là tìm một phân phối chia vô hạn không bình thường và chia nó ra. Nếu bạn có một cái sẽ tiếp cận mức bình thường khi bạn tính trung bình hoặc tổng hợp nó, hãy bắt đầu ở ranh giới 'gần với bình thường' và chia nó bao nhiêu tùy thích. Ví dụ:
Xem xét phân phối Gamma với tham số hình dạng . Lấy tỷ lệ là 1 (thang đo không thành vấn đề). Giả sử bạn coi Gamma ( α 0 , 1 ) là "đủ bình thường". Sau đó, một phân phối mà bạn cần phải nhận được 1000 quan sát để có đủ bình thường có Gamma ( α 0 / 1000 , 1 ) phân phối.αGamma ( α0, 1 )Gamma ( α0/ 1000,1)
Vì vậy, nếu bạn cảm thấy rằng một Gamma có chỉ là 'đủ bình thường' -α = 20
Sau đó chia cho 1000, để có được α = 0,02 :α = 20α = 0,02
Trung bình 1000 trong số đó sẽ có hình dạng của pdf đầu tiên (nhưng không phải là tỷ lệ của nó).
σ/ n--√
@ quan điểm của những người phân phối bị ô nhiễm là một điều rất tốt; nó có thể trả tiền để thử một số mô phỏng với trường hợp đó và xem mọi thứ hoạt động như thế nào trên nhiều mẫu như vậy.