Ví dụ về phân phối trong đó cỡ mẫu lớn là cần thiết cho định lý giới hạn trung tâm


19

Một số sách nêu kích thước mẫu có kích thước 30 hoặc cao hơn là cần thiết cho định lý giới hạn trung tâm để đưa ra một xấp xỉ tốt cho . X¯

Tôi biết điều này là không đủ cho tất cả các bản phân phối.

Tôi muốn xem một số ví dụ về phân phối trong đó ngay cả với cỡ mẫu lớn (có thể là 100 hoặc 1000 hoặc cao hơn), phân phối của giá trị trung bình mẫu vẫn bị sai lệch.

Tôi biết tôi đã thấy những ví dụ như vậy trước đây, nhưng tôi không thể nhớ nơi nào và tôi không thể tìm thấy chúng.


5
Hãy xem xét phân phối Gamma với tham số hình dạng . Lấy tỷ lệ là 1 (không thành vấn đề). Hãy nói rằng bạn coi như chỉ "đủ bình thường". Sau đó, một phân phối mà bạn cần để có 1000 quan sát đủ bình thường có phân phối . Gamma ( α 0 , 1 ) Gamma ( α 0 / 1000 , 1 )αGamma(α0,1)Gamma(α0/1000,1)
Glen_b -Reinstate Monica

1
@Glen_b, tại sao không làm cho câu trả lời chính thức và phát triển nó một chút?
gung - Phục hồi Monica

4
Mọi phân phối bị ô nhiễm đủ sẽ hoạt động, dọc theo cùng dòng với ví dụ của @ Glen_b. Ví dụ: khi phân phối cơ bản là hỗn hợp của Bình thường (0,1) và Bình thường (giá trị lớn, 1), với phân phối thứ hai chỉ có xác suất xuất hiện nhỏ, thì hầu hết mọi thứ đều thú vị xảy ra: (1) hầu hết thời gian , sự ô nhiễm không xuất hiện và không có bằng chứng về độ lệch; nhưng (2) đôi khi sự nhiễm bẩn xuất hiện và độ lệch trong mẫu là rất lớn. Việc phân phối trung bình mẫu sẽ bị sai lệch cao bất kể nhưng bootstrapping ( ví dụ ) thường sẽ không phát hiện ra nó.
whuber

1
Ví dụ của @ whuber mang tính hướng dẫn, cho thấy định lý giới hạn trung tâm, về mặt lý thuyết, có thể bị đánh lừa một cách tùy tiện. Trong các thí nghiệm thực tế, tôi cho rằng một người cần phải tự hỏi mình liệu có thể có một số hiệu ứng rất lớn xảy ra rất hiếm khi xảy ra hay không, và áp dụng kết quả lý thuyết với một chút chu vi.
David Epstein

Câu trả lời:


19

Một số sách nêu một cỡ mẫu kích thước 30 hoặc cao hơn là cần thiết cho việc giới hạn trung tâm lý để đưa ra một xấp xỉ tốt cho .X¯

Quy tắc chung này là khá nhiều hoàn toàn vô dụng. Có các phân phối không bình thường trong đó n = 2 sẽ hoạt động tốt và các phân phối không bình thường mà lớn hơn không đủ - vì vậy không có giới hạn rõ ràng về các trường hợp, quy tắc này gây hiểu nhầm. Trong mọi trường hợp, ngay cả khi đó là sự thật, n yêu cầu sẽ thay đổi tùy thuộc vào những gì bạn đang làm. Thường thì bạn nhận được xấp xỉ tốt gần trung tâm phân phối ở n nhỏ , nhưng cần n lớn hơn nhiều để có được xấp xỉ khá ở đuôi.nnnn

Chỉnh sửa: Xem câu trả lời cho câu hỏi này để biết nhiều ý kiến ​​nhưng rõ ràng nhất trí về vấn đề đó và một số liên kết tốt. Tôi sẽ không chuyển dạ mặc dù, vì bạn đã hiểu rõ về nó.

Tôi muốn xem một số ví dụ về phân phối trong đó ngay cả với cỡ mẫu lớn (có thể 100 hoặc 1000 hoặc cao hơn), phân phối của trung bình mẫu vẫn bị sai lệch.

Các ví dụ tương đối dễ xây dựng; một cách dễ dàng là tìm một phân phối chia vô hạn không bình thường và chia nó ra. Nếu bạn có một cái sẽ tiếp cận mức bình thường khi bạn tính trung bình hoặc tổng hợp nó, hãy bắt đầu ở ranh giới 'gần với bình thường' và chia nó bao nhiêu tùy thích. Ví dụ:

Xem xét phân phối Gamma với tham số hình dạng . Lấy tỷ lệ là 1 (thang đo không thành vấn đề). Giả sử bạn coi Gamma ( α 0 , 1 ) là "đủ bình thường". Sau đó, một phân phối mà bạn cần phải nhận được 1000 quan sát để có đủ bình thường có Gamma ( α 0 / 1000 , 1 ) phân phối.αGamma(α0,1)Gamma(α0/1000,1)

Vì vậy, nếu bạn cảm thấy rằng một Gamma có chỉ là 'đủ bình thường' -α= =20

Gamma (20) pdf

Sau đó chia cho 1000, để có được α = 0,02 :α= =20α= =0,02

Gamma (0,02) pdf

Trung bình 1000 trong số đó sẽ có hình dạng của pdf đầu tiên (nhưng không phải là tỷ lệ của nó).

σ/n

@ quan điểm của những người phân phối bị ô nhiễm là một điều rất tốt; nó có thể trả tiền để thử một số mô phỏng với trường hợp đó và xem mọi thứ hoạt động như thế nào trên nhiều mẫu như vậy.



9

Bạn có thể thấy bài viết này hữu ích (hoặc ít nhất là thú vị):

http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf

Các nhà nghiên cứu tại UMass thực sự đã thực hiện một nghiên cứu tương tự như những gì bạn đang hỏi. Ở cỡ mẫu nào, dữ liệu phân tán nhất định tuân theo phân phối bình thường do CLT? Rõ ràng rất nhiều dữ liệu được thu thập cho các thí nghiệm tâm lý không phải là nơi được phân phối bình thường, vì vậy ngành học phụ thuộc khá nhiều vào CLT để thực hiện bất kỳ suy luận nào về số liệu thống kê của họ.

α= =0,05

Table 2. Percentage of replications that departed normality based on the KS-test. 
 Sample Size 
           5   10   15   20   25  30 
Normal   100   95   70   65   60  35 
Uniform  100  100  100  100  100  95 
Bimodal  100  100  100   75   85  50

Thật kỳ lạ, 65 phần trăm dữ liệu phân phối thông thường đã bị từ chối với cỡ mẫu là 20 và ngay cả với cỡ mẫu là 30, 35% vẫn bị từ chối.

Sau đó, họ đã thử nghiệm một số bản phân phối sai lệch được tạo ra bằng phương pháp sức mạnh của Fleishman:

Y= =mộtX+bX2+cX3+dX4

X đại diện cho giá trị được rút ra từ phân phối chuẩn trong khi a, b, c và d là các hằng số (lưu ý rằng a = -c).

Họ đã chạy thử nghiệm với cỡ mẫu lên tới 300

Skew  Kurt   A      B      C       D 
1.75  3.75  -0.399  0.930  0.399  -0.036 
1.50  3.75  -0.221  0.866  0.221   0.027 
1.25  3.75  -0.161  0.819  0.161   0.049 
1.00  3.75  -0.119  0.789  0.119   0.062 

Họ phát hiện ra rằng ở mức độ xiên và kurt cao nhất (1,75 và 3,75) rằng cỡ mẫu 300 không tạo ra mẫu có nghĩa là tuân theo phân phối bình thường.

Thật không may, tôi không nghĩ rằng đây chính xác là những gì bạn đang tìm kiếm, nhưng tôi tình cờ thấy nó và thấy nó thú vị, và nghĩ rằng bạn cũng có thể.


4
" Thật kỳ lạ, 65 phần trăm dữ liệu được phân phối thông thường đã bị từ chối với cỡ mẫu là 20 và ngay cả với cỡ mẫu là 30, 35% vẫn bị từ chối. " - sau đó có vẻ như họ đang sử dụng thử nghiệm sai; như một thử nghiệm về tính quy tắc trên dữ liệu thông thường được chỉ định hoàn toàn (đó là những gì thử nghiệm dành cho), nếu họ sử dụng đúng, thì phải chính xác .
Glen_b -Reinstate Monica

5
@Glen_b: Có nhiều nguồn lỗi tiềm ẩn ở đây. Nếu bạn đọc tài liệu, bạn sẽ lưu ý rằng những gì được liệt kê là "bình thường" ở đây thực sự là các biến thiên ngẫu nhiên bình thường với trung bình 50 và độ lệch chuẩn là 10 được làm tròn đến số nguyên gần nhất . Vì vậy, theo nghĩa đó, thử nghiệm được sử dụng đã sử dụng phân phối sai chính tả. Thứ hai, nó vẫn xuất hiện họ đã thực hiện các bài kiểm tra không đúng cách, như những nỗ lực của tôi tại sao chép cho thấy rằng đối với một bình mẫu sử dụng 20 quan sát như vậy, xác suất từ chối là khoảng 27%. (tt)
Đức hồng y

5
(tt) Thứ ba, bất kể ở trên, một số phần mềm có thể sử dụng phân phối tiệm cận và không phải là phân phối thực tế, mặc dù ở cỡ mẫu 10K, điều này không quá quan trọng (nếu các mối quan hệ không được tạo ra một cách giả tạo trên dữ liệu). Cuối cùng, chúng tôi tìm thấy một tuyên bố khá kỳ lạ sau đây ở gần cuối tài liệu đó: Thật không may, các thuộc tính của kiểm tra KS trong S-PLUS đã hạn chế công việc. Các giá trị p cho nghiên cứu hiện tại đều được tổng hợp bằng tay trên nhiều bản sao. Một chương trình là cần thiết để tính toán các giá trị p và đưa ra đánh giá về chúng so với mức độ alpha được chọn.
Đức hồng y

3
Xin chào @Glen_b. Tôi không tin việc làm tròn sẽ làm giảm tỷ lệ từ chối ở đây vì tôi tin rằng họ đã kiểm tra phân phối chuẩn thông thường thực sự bằng cách sử dụng dữ liệu làm tròn (đó là ý tôi muốn nói khi kiểm tra sử dụng phân phối sai chính tả). (Có lẽ, thay vào đó, bạn đã nghĩ đến việc sử dụng thử nghiệm KS trên một bản phân phối rời rạc.) Cỡ mẫu cho thử nghiệm KS là 10000, không phải 20; họ đã thực hiện 20 lần lặp lại ở cỡ mẫu 10000 mỗi lần để lấy bảng. Ít nhất, đó là sự hiểu biết của tôi về mô tả từ việc đọc lướt tài liệu.
Đức hồng y

3
@cardinal - tất nhiên, bạn đã đúng, vì vậy có lẽ đó có thể là nguồn gốc của một lượng lớn các từ chối ở các cỡ mẫu lớn. Re: " Cỡ mẫu cho thử nghiệm KS là 10000, không phải 20 " ... được rồi, điều này nghe có vẻ ngày càng kỳ quặc. Một người còn lại để tự hỏi tại sao họ lại nghĩ một trong những điều kiện đó có giá trị hơn là nói theo cách khác.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.