Làm thế nào định lý giới hạn trung tâm có thể giữ cho các phân phối có giới hạn về biến ngẫu nhiên?


10

Tôi luôn luôn đặt ra vấn đề và chưa bao giờ được đưa ra một câu trả lời hay, vì làm thế nào có thể định lý giới hạn trung tâm - phiên bản cổ điển trong đó phân phối mẫu có nghĩa là tiếp cận tính quy tắc - có thể áp dụng để phân phối Poisson hoặc Gamma, trong đó . Hoặc, đối với vấn đề đó, bất kỳ phân phối nào khác mà hoặc có lẽ .P(x<0)=0X:X,F(X)=0X:X,1F(X)=0

Ví dụ: được phân phối Gamma, như số lượng mẫu , , , đối với một số . Nhưng nếu , . Đơn giản là sẽ không bao giờ, EVER là một . Điều này gợi ý cho tôi rằng phân phối của không thể, cũng không phải là cách tiếp cận, tính quy tắc vì phải nhất thiết phải là , , không đáp ứng các yêu cầu của một phân phối chuẩn mà .nP(X¯=α)1α0X¯iα<0P(X¯=α)=0X¯i<0X¯f(X¯)0X¯<0f(y)>0,yR

Tôi cảm thấy tốt hơn nhiều về cuộc sống và bất cứ điều gì dựa trên CLT nếu ai đó có thể giúp tôi hiểu logic của tôi đã đi lạc hướng.


6
Công thức ban đầu của CLT được áp dụng cho biến Bernoulli : ví dụ với các giới hạn nghiêm ngặt nhất có thể! Tại sao không, sau đó, xem xét trường hợp cụ thể đó trong tìm kiếm của bạn cho lỗi trong logic. Nếu câu trả lời không trở nên rõ ràng ngay lập tức (gợi ý: hãy suy nghĩ về việc tiêu chuẩn hóa nghĩa là gì), có lẽ tài khoản của tôi tại stats.stackexchange.com/questions/3734/ sẽ gợi ý một số ý tưởng.
whuber

4
Có thể giúp xem xét một phiên bản cơ bản của định lý giới hạn trung tâm thực sự nói gì, và từ đó xem xét các giới hạn trên trung bình được chuẩn hóa trông như thế nào.
Glen_b -Reinstate Monica

Câu trả lời:


14

Đây là một câu hỏi xuất sắc, vì nó cho thấy rằng bạn đang suy nghĩ về các khía cạnh trực quan của các định lý bạn đang học. Điều đó đặt bạn trước hầu hết các sinh viên học CLT. Ở đây tôi sẽ cố gắng cung cấp cho bạn một lời giải thích về cách CLT có thể giữ các biến ngẫu nhiên với sự hỗ trợ hạn chế.

Các giới hạn lý trung tâm cổ điển áp dụng cho bất kỳ chuỗiX1,X2,X3,...IID Dist(μ,σ2) bao gồm các biến ngẫu nhiên độc lập và phân phối giống hệt nhau với giá trị trung bình tùy ý μ và phương sai hữu hạn khác không 0<σ2<. Bây giờ, giả sử rằng bạn có một chuỗi như vậy, và chúng bị giới hạn bởixminXixmaxvà do đó, hỗ trợ của họ không bao gồm toàn bộ dòng thực.

Định lý giới hạn trung tâm liên quan đến phân phối trung bình mẫu và từ hỗ trợ hạn chế trên các biến ngẫu nhiên cơ bản trong trình tự, thống kê này cũng phải tuân theo giới hạn . Vì vậy, cốt truyện dày lên - mẫu có nghĩa là chủ đề của định lý cũng bị ràng buộc! Làm thế nào CLT có thể giữ nếu đây là trường hợp?X¯n1ni=1nXixminX¯nxmax

Định lý giới hạn trung tâm (CLT): Cho phép là hàm phân phối chuẩn thông thường, chúng ta có:Φ

limnP(X¯nμσ/nz)=Φ(z).

Xấp xỉ phát sinh từ CLT: Đối với lớn, chúng ta có phân phối gần đúng :n

X¯nN(μ,σ2n).

Vấn đề của bạn xuất phát từ thực tế là xấp xỉ phân phối phát sinh từ định lý này gần đúng với phân phối với sự hỗ trợ giới hạn bởi một hỗ trợ không giới hạn, và do đó, nó không thể đúng. Bạn đã đúng về điều đó --- xấp xỉ phân phối cho lớn chỉ là xấp xỉ và thực sự xác định sai xác suất mà giá trị trung bình mẫu nằm ngoài giới hạn của nó (bằng cách đưa ra xác suất dương này).n

Tuy nhiên, CLT không phải là một tuyên bố về xấp xỉ phân phối cho hữu hạn . Đó là về phân phối giới hạn của trung bình mẫu chuẩn . Các giới hạn về số lượng này là:n

zmin=xminμσ/nX¯nμσ/nxmaxμσ/n=zmax.

Bây giờ, vì chúng tôi có giới hạn và có nghĩa là giới hạn của mẫu chuẩn có nghĩa là rộng hơn và rộng hơn và hội tụ trong giới hạn cho toàn bộ dòng thực. (Hoặc để chính thức hơn một chút, đối với bất kỳ điểm nào trong đường thẳng thực, các giới hạn sẽ bao gồm điểm đó cho một số đủ lớn .) Một hậu quả của điều này là xác suất được gán cho các phần bên ngoài giới hạn bởi bình thường phân phối hội tụ về 0 dưới dạng .nzminzmaxnn

Ở đây chúng tôi nhận được cốt lõi của vấn đề liên quan đến những hiểu lầm của bạn về CLT. Đúng là với bất kỳ hữu hạn nào , một xấp xỉ bình thường đối với phân phối trung bình mẫu sẽ đưa ra xác suất dương cho các tập hợp con của các giá trị nằm ngoài giới hạn của hỗ trợ thực sự. Tuy nhiên, khi chúng tôi đưa ra giới hạn thì xác suất dương sai lầm này hội tụ về không. Giá trị gần đúng phân phối cho mẫu chuẩn có nghĩa là hội tụ đến phân phối thực của đại lượng này trong giới hạn, mặc dù phép tính gần đúng không giữ chính xác cho hữu hạn .nnn


3

Nguồn nhầm lẫn của bạn bắt nguồn từ hai nguồn:

1) CLT áp dụng cho các phương tiện mẫu được chuẩn hóa , nghĩa là:

Zn=Sn/nμσ/n=Snnμσn ,

được tập trung quanh 0, do đó thừa nhận các giá trị âm với xác suất dương. Như một ví dụ cực đoan, nếu thì có thể âm đối với Poisson . Trong thực tế, bạn có thể dễ dàng kết luận rằng nếu không bao giờ âm, thì phải là hằng số (do đó ).n=1X1μσX1ZnXiσ=0

2) CLT cho hữu hạn chỉ là kết quả cục bộ xung quanh giá trị trung bình. Nói cách khác, thực tế là xấp xỉ (CDF bình thường), bình thường có xu hướng đúng hơn với gần 0. Khi không đủ lớn, so với , điều này xấp xỉ phá vỡ.nP(Znx)ϕ(x)xnx

Nếu bạn nói, đo chiều cao của mọi người, thì một xấp xỉ bình thường tiêu chuẩn có thể ngụ ý rằng chiều cao âm có xác suất dương. Điều này là sai vì hầu hết người trưởng thành có chiều cao từ 4 đến 7 feet, do đó, xấp xỉ sẽ phá vỡ vượt quá các giới hạn này nếu của bạn nhỏ.n

Ngoài ra, nếu và , thì sẽ cần nhiều nhận thức về để suy ra các tình huống trong đó âm tính, do đó sẽ chủ yếu là dương và bạn có thể ( sai lầm) kết luận rằng nó không bao giờ có thể là tiêu cực.P(Xi=1)=0.99999P(Xi=1)=0.00001XiXiZn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.