Câu trả lời này hy vọng sẽ đưa ra một ý nghĩa trực quan của định lý giới hạn trung tâm, sử dụng các kỹ thuật tính toán đơn giản (Taylor mở rộng bậc 3). Đây là phác thảo:
- CLT nói gì
- Một bằng chứng trực quan về CLT bằng phép tính đơn giản
- Tại sao phân phối bình thường?
Chúng tôi sẽ đề cập đến phân phối bình thường vào cuối; bởi vì thực tế là sự phân phối bình thường cuối cùng xuất hiện không mang nhiều trực giác.
1. Định lý giới hạn trung tâm nói gì? Một số phiên bản của CLT
xX1,⋯,Xn
P(X1+⋯+Xnn−−√≤x)→n→+∞∫x−∞e−t2/22π−−√dt.
X1.,…,XnZ1,…,ZnE[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0
fxf(t)={1 if t<x0 if t≥x.
X1,…,XnZ1,…,Zn
Một số phiên bản khác của CLT có đề cập đến lớp các hàm của Lipschtiz được giới hạn bởi 1; một số phiên bản khác của CLT đề cập đến lớp các hàm trơn tru với đạo hàm giới hạn của thứ tự . Hãy xem xét hai chuỗi và như trên và đối với một số hàm , kết quả hội tụ (CONV)kX1,…,XnZ1,…,Znf
E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]→n→+∞0(CONV)
Có thể thiết lập sự tương đương ("nếu và chỉ khi") giữa các câu lệnh sau:
- (CONV) ở trên giữ cho mọi hàm chỉ số có dạng với và đối với đối với một số thực cố định .ff(t)=1t<xf(t)=0t≥xx
- (CONV) giữ cho mỗi bị chặn chức năng Lipschitz .f:R→R
- (CONV) giữ cho mọi chức năng trơn tru (nghĩa là ) với sự hỗ trợ nhỏ gọn.C∞
- (CONV) giữ cho mọi chức năng ba lần liên tục khác nhau với .fsupx∈R|f′′′(x)|≤1
Mỗi điểm trong 4 điểm trên nói rằng sự hội tụ giữ cho một lớp lớn các hàm. Bằng một lập luận gần đúng về mặt kỹ thuật, người ta có thể chỉ ra rằng bốn điểm trên là tương đương nhau, chúng tôi giới thiệu người đọc đến Chương 7, trang 77 của cuốn sách David Pollard Hướng dẫn sử dụng để đo lường xác suất lý thuyết mà từ đó câu trả lời này được truyền cảm hứng cao.
Giả định của chúng tôi cho phần còn lại của câu trả lời này ...
Chúng tôi sẽ giả sử rằng cho một số hằng số , tương ứng với điểm 4 ở trên. Chúng tôi cũng sẽ giả sử rằng các biến ngẫu nhiên có hữu hạn, giới hạn thứ ba: và
là hữu hạn.supx∈R|f′′′(x)|≤CC>0E[|Xi|3]E[|Zi|3]
2. Giá trị của là phổ biến: nó không phụ thuộc vào phân phối củaE[f(X1+⋯+Xnn√)]X1,...,Xn
Hãy để chúng tôi chỉ ra rằng đại lượng này là phổ quát (tối đa một thuật ngữ lỗi nhỏ), theo nghĩa là nó không phụ thuộc vào bộ sưu tập các biến ngẫu nhiên độc lập nào được cung cấp. Lấy và hai chuỗi biến ngẫu nhiên độc lập, mỗi chuỗi có giá trị trung bình 0 và phương sai 1 và giây thứ ba hữu hạn.X1,…,XnZ1,…,Zn
Ý tưởng là lặp lại thay thế bằng theo một trong số lượng và kiểm soát sự khác biệt bằng phép tính cơ bản (ý tưởng, tôi tin rằng, là do Lindeberg). Bằng cách mở rộng Taylor, nếu và thì
trong đó vàXiZiW=Z1+⋯+Zn−1h(x)=f(x/n−−√)
h(Z1+⋯+Zn−1+Xn)h(Z1+⋯+Zn−1+Zn)=h(W)+Xnh′(W)+X2nh′′(W)2+X3n/h′′′(Mn)6=h(W)+Znh′(W)+Z2nh′′(W)2+Z3nh′′′(M′n)6
MnM′nlà trung điểm được cho bởi định lý giá trị trung bình. Lấy kỳ vọng trên cả hai dòng, thuật ngữ thứ tự zeroth là như nhau, các điều khoản thứ tự đầu tiên là bằng nhau vì kỳ vọng của và , và tương tự cho dòng thứ hai. Một lần nữa bởi sự độc lập, các điều khoản thứ hai là giống nhau trong kỳ vọng. Các thuật ngữ duy nhất còn lại là thứ tự thứ ba, và trong kỳ vọng, sự khác biệt giữa hai dòng nhiều nhất là
Ở đây là giới hạn trên của đạo hàm thứ ba của . Mẫu số xuất hiện vì
XnWE[Xnh′(W)]=E[Xn]E[h′(W)]=0(C/6)E[|Xn|3+|Zn|3](n−−√)3.
Cf′′′(n−−√)3h′′′(t)=f′′′(t/n−−√)/(n−−√)3 .
Nếu độc lập, sự đóng góp của trong tổng là vô nghĩa vì nó có thể được thay thế bằng mà không phát sinh lỗi lớn hơn màn hình trên!XnZn
Bây giờ chúng tôi nhắc lại để thay thế bằng . Nếu thì
Bằng sự độc lập của và và bởi sự độc lập của vàXn−1Zn−1W~=Z1+Z2+⋯+Zn−2+Xn
h(Z1+⋯+Zn−2+Xn−1+Xn)h(Z1+⋯+Zn−2+Zn−1+Xn)=h(W~)+Xn−1h′(W~)+X2n−1h′′(W~)2+X3n−1/h′′′(M~n)6=h(W~)+Zn−1h′(W~)+Z2n−1h′′(W~)2+Z3n−1/h′′′(M~n)6.
Zn−1W~Xn−1W~, một lần nữa zeroth, các điều khoản thứ tự đầu tiên và thứ hai là bằng nhau trong kỳ vọng cho cả hai dòng. Sự khác biệt về kỳ vọng giữa hai dòng một lần nữa nhiều nhất là
Chúng tôi tiếp tục lặp đi lặp lại cho đến khi chúng tôi thay thế tất cả bằng . Bằng cách thêm các lỗi được thực hiện ở mỗi bước, chúng ta sẽ có được
như
(C/6)E[|Xn−1|3+|Zn−1|3](n−−√)3.
ZiXin∣∣E[f(X1+⋯+Xnn√)]−E[f(Z1+⋯+Znn√)]∣∣≤n(C/6)maxi=1,…,nE[|Xi|3+|Zi|3](n−−√)3.
ntăng, phía bên tay phải trở nên nhỏ tùy ý nếu khoảnh khắc thứ ba hoặc các biến ngẫu nhiên là hữu hạn (giả sử đó là trường hợp). Điều này có nghĩa là các kỳ vọng ở bên trái trở nên gần nhau tùy ý, bất kể phân phối của xa so với .
Bằng tính độc lập, đóng góp của mỗi trong tổng là vô nghĩa vì nó có thể được thay thế bằng mà không phát sinh lỗi lớn hơn .
Và thay thế tất cả bằng không thay đổi số lượng nhiều hơn .
X1,…,XnZ1,…,ZnXiZiO(1/(n−−√)3)XiZiO(1/n−−√)
Kỳ vọng vì thế là phổ biến, nó không phụ thuộc vào phân phối của . Mặt khác, tính độc lập và có tầm quan trọng tối đa đối với các giới hạn trên.E[f(X1+⋯+Xnn√)]X1,…,XnE[Xi]=E[Zi]=0,E[Z2i]=E[X2i]=1
3. Tại sao phân phối bình thường?
Chúng tôi đã thấy rằng kỳ vọng sẽ giống nhau cho dù phân phối của là gì, cho đến khi lỗi nhỏ của đơn hàng .E[f(X1+⋯+Xnn√)]XiO(1/n−−√)
Nhưng đối với các ứng dụng, sẽ rất hữu ích khi tính toán số lượng như vậy. Cũng rất hữu ích khi có được biểu thức đơn giản hơn cho đại lượng này .E[f(X1+⋯+Xnn√)]
Vì số lượng này là giống nhau cho mọi bộ sưu tập , chúng tôi chỉ cần chọn một bộ sưu tập cụ thể sao cho phân phối dễ tính toán hoặc dễ nhớ.X1,…,Xn(X1+⋯+Xn)/n−−√
Đối với phân phối chuẩn , số lượng này trở nên thực sự đơn giản. Thật vậy, nếu là iid thì cũng có phân phối và nó không phụ thuộc vào ! Do đó, nếu , thì
và theo đối số trên, đối với mọi tập hợp các biến ngẫu nhiên độc lập với , sau đóN(0,1)Z1,…,ZnN(0,1)Z1+⋯+Znn√N(0,1)nZ∼N(0,1)
E[f(Z1+⋯+Znn−−√)]=E[f(Z)],
X1,…,XnE[Xi]=0,E[X2i]=1
∣∣∣E[f(X1+⋯+Xnn−−√)]−E[f(Z)∣∣∣≤supx∈R|f′′′(x)|maxi=1,…,nE[|Xi|3+|Z|3]6n−−√.