Việc áp dụng CLT cho tổng các biến ngẫu nhiên có phải là một xấp xỉ tốt không?


7

Tôi sử dụng để có nghĩa là một phân phối có nghĩa là và phương sai , được thêm vào có nghĩa là phân phối bình thường.(μ,σ2)μσ2N

Giả sử với . Tuyên bố chính thức của định lý giới hạn trung tâm (CLT) nói rằng Ở đây đã thảo luận rằng câu lệnh không phải là một tuyên bố về sự hội tụ trong phân phối, nhưng đúng hơn là một xấp xỉ. Xấp xỉ này thường được trích dẫn là một xấp xỉ khá tốt khi .X1,,Xniid(μ,σ2)σ2<

X¯n-μσ/ndN(0,1).
X¯n~N(μ,σ2/n)
n30

Bây giờ, về mặt lý thuyết, chúng ta có thể tiến thêm một bước và nói rằng là một tuyên bố gần đúng từ CLT.

(1)ΣTôi= =1nXTôi~N(nμ,nσ2)

Cho rằng không phải là CLT thực tế, tôi tự hỏi sự gần đúng này thực hiện tốt như thế nào. Nó có hoạt động tốt nói chung không? Thành thật mà nói, tôi lo ngại về điều này trong trường hợp phân phối bị sai lệch.(1)

Nếu cái này quá rộng, tôi có thể đóng cái này lại.


2
Đây là một câu hỏi rất hay. Bạn có thể tìm thấy câu trả lời đã xuất hiện, mặc dù. Hãy thử tìm kiếm này: stats.stackexchange.com/search?q=esseen .
whuber

2
Bạn có thể muốn xem định lý Berry-Esseen để biết thông tin về tốc độ hội tụ. Thuật ngữ gần đúng tốt là chủ quan. Để được xác định chính xác khoảng cách tối đa giữa phân phối gần đúng và tiêu chuẩn thông thường cần phải là gần đúng là "tốt".
Michael R. Chernick

1
Tôi không nghĩ là một ký hiệu đủ chính xác (ngay cả với văn bản bổ sung giải thích về nó). Một ký hiệu tốt hơn sẽ là " là ", với sự hiểu rằng nó có nghĩa là hội tụ đến trong phân phối. X¯n~N(μ,σ2/n)X¯nAN(μ,σ2/n)n(X¯nμ)/σN(0,1)
Zhanxiong

1
@Zhanxiong: ký hiệu tôi quen thuộc hơn là X¯n~˙N(μ,σ2/n), với ~˙có nghĩa là "phân phối xấp xỉ".
Vách đá AB

1
Theo kinh nghiệm, chất lượng gần đúng phụ thuộc vào phân phối cơ bản của XTôi. Theo trực giác, phép tính gần đúng hoạt động tốt hơn cho các rv đối xứng và liên tục Ví dụ, bạn có thể cần nhỏ hơn nhiềun để có được một xấp xỉ bình thường tốt cho X~Thùng rác(1,0,5) hơn thế cho XBin(1,0.01).
Zhanxiong

Câu trả lời:


5

Đi ngược lại, nếu điểm Z thực sự là một phân phối chuẩn thông thường, thì các xấp xỉ tiếp theo của bạn sẽ chính xác. Mức độ lỗi sẽ tăng theo tỷ lệ với một số thước đo khoảng cách giữa phân bố điểm Z và Gaussian tiêu chuẩn.

Chúng tôi có thể sử dụng khoảng cách KS làm số liệu của chúng tôi trong không gian của CDF. Hãy nói rằng chúng tôi sẽ thu thậpN các mẫu và CDF mẫu thực sự (chưa biết) của chúng tôi về điểm Z của các mẫu này N các mẫu sẽ có khoảng cách KS là εN: tối đaz|FZn(z)-FΦ(z)|= =εN.

Bây giờ, đi từ FZn(z) đến FSn(S) Ở đâu Sn= =Σ1NXTôi chỉ liên quan đến sự thay đổi quy mô và vị trí (nghĩa là chuyển đổi tuyến tính Lz lập luận của FZn(z)). Áp dụng tương tự để có đượcFΦ(z)đến tổng các biến ngẫu nhiên bình thường có cùng giá trị trung bình và phương sai với dân số thực tế của bạn. Trong thực tế, bạn sẽ thực hiện chuyển đổi chính xác cho cả hai biến, vì vậy chúng tôi sẽ chỉ đơn giản là ánh xạFZn(z)FZn(L-1z) và tương tự cho FΦ - bởi vì chúng tôi đang tuân theo từng đối số của phân phối cho cùng một phép chuyển đổi, chúng tôi sẽ duy trì khoảng cách dọc.

Vì vậy, khoảng cách KS cho FSn sẽ hội tụ về 0 với cùng tốc độ như đối với FZn. Tuy nhiên,FSn không có phân phối giới hạn (về cơ bản là F(x)= =0,5, mà không phải là một bản phân phối) trong khi FZn hội tụ đến một chức năng phân phối thực tế.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.