Đây là một câu hỏi xuất sắc, vì nó cho thấy rằng bạn đang suy nghĩ về các khía cạnh trực quan của các định lý bạn đang học. Điều đó đặt bạn trước hầu hết các sinh viên học CLT. Ở đây tôi sẽ cố gắng cung cấp cho bạn một lời giải thích về cách CLT có thể giữ các biến ngẫu nhiên với sự hỗ trợ hạn chế.
Các giới hạn lý trung tâm cổ điển áp dụng cho bất kỳ chuỗiX1,X2,X3,...∼IID Dist(μ,σ2) bao gồm các biến ngẫu nhiên độc lập và phân phối giống hệt nhau với giá trị trung bình tùy ý μ và phương sai hữu hạn khác không 0<σ2<∞. Bây giờ, giả sử rằng bạn có một chuỗi như vậy, và chúng bị giới hạn bởixmin⩽Xi⩽xmaxvà do đó, hỗ trợ của họ không bao gồm toàn bộ dòng thực.
Định lý giới hạn trung tâm liên quan đến phân phối trung bình mẫu và từ hỗ trợ hạn chế trên các biến ngẫu nhiên cơ bản trong trình tự, thống kê này cũng phải tuân theo giới hạn . Vì vậy, cốt truyện dày lên - mẫu có nghĩa là chủ đề của định lý cũng bị ràng buộc! Làm thế nào CLT có thể giữ nếu đây là trường hợp?X¯n≡1n∑ni=1Xixmin⩽X¯n⩽xmax
Định lý giới hạn trung tâm (CLT): Cho phép là hàm phân phối chuẩn thông thường, chúng ta có:Φ
limn→∞P(X¯n−μσ/n−−√⩽z)=Φ(z).
Xấp xỉ phát sinh từ CLT: Đối với lớn, chúng ta có phân phối gần đúng :n
X¯n∼N(μ,σ2n).
Vấn đề của bạn xuất phát từ thực tế là xấp xỉ phân phối phát sinh từ định lý này gần đúng với phân phối với sự hỗ trợ giới hạn bởi một hỗ trợ không giới hạn, và do đó, nó không thể đúng. Bạn đã đúng về điều đó --- xấp xỉ phân phối cho lớn chỉ là xấp xỉ và thực sự xác định sai xác suất mà giá trị trung bình mẫu nằm ngoài giới hạn của nó (bằng cách đưa ra xác suất dương này).n
Tuy nhiên, CLT không phải là một tuyên bố về xấp xỉ phân phối cho hữu hạn . Đó là về phân phối giới hạn của trung bình mẫu chuẩn . Các giới hạn về số lượng này là:n
zmin=xmin−μσ/n−−√⩽X¯n−μσ/n−−√⩽xmax−μσ/n−−√=zmax.
Bây giờ, vì chúng tôi có giới hạn và có nghĩa là giới hạn của mẫu chuẩn có nghĩa là rộng hơn và rộng hơn và hội tụ trong giới hạn cho toàn bộ dòng thực. (Hoặc để chính thức hơn một chút, đối với bất kỳ điểm nào trong đường thẳng thực, các giới hạn sẽ bao gồm điểm đó cho một số đủ lớn .) Một hậu quả của điều này là xác suất được gán cho các phần bên ngoài giới hạn bởi bình thường phân phối hội tụ về 0 dưới dạng .n→∞zmin→−∞zmax→∞nn→∞
Ở đây chúng tôi nhận được cốt lõi của vấn đề liên quan đến những hiểu lầm của bạn về CLT. Đúng là với bất kỳ hữu hạn nào , một xấp xỉ bình thường đối với phân phối trung bình mẫu sẽ đưa ra xác suất dương cho các tập hợp con của các giá trị nằm ngoài giới hạn của hỗ trợ thực sự. Tuy nhiên, khi chúng tôi đưa ra giới hạn thì xác suất dương sai lầm này hội tụ về không. Giá trị gần đúng phân phối cho mẫu chuẩn có nghĩa là hội tụ đến phân phối thực của đại lượng này trong giới hạn, mặc dù phép tính gần đúng không giữ chính xác cho hữu hạn .nn→∞n