Định lý giới hạn trung tâm cho căn bậc hai của tổng các biến ngẫu nhiên iid


11

Bị thu hút bởi một câu hỏi tại math.stackexchange và điều tra nó theo kinh nghiệm, tôi tự hỏi về tuyên bố sau đây về căn bậc hai của các biến ngẫu nhiên iid.

Giả sử là các biến ngẫu nhiên có ý nghĩa hữu hạn khác không và phương sai và . Định lý giới hạn trung tâm cho biết khi tăng. μ σ 2 Y = n Σ i = 1 X i Y - n μX1,X2,,Xnμσ2Y=i=1nXinYnμnσ2 d N(0,1)n

Nếu , tôi cũng có thể nói điều gì đó như khi tăng?Z - Z=|Y|nZn|μ|σ24|μ|σ24|μ| d N(0,1)n

Ví dụ: giả sử là Bernoulli với trung bình và phương sai , thì là nhị thức và tôi có thể mô phỏng điều này trong R, nói với : p p ( 1 - p ) Y p = 1Xipp(1p)Yp=13

set.seed(1)
cases <- 100000
n <- 1000
p <- 1/3
Y <- rbinom(cases, size=n, prob=p)
Z <- sqrt(abs(Y))

cung cấp xấp xỉ trung bình và phương sai choZ

> c(mean(Z), sqrt(n*p - (1-p)/4))
[1] 18.25229 18.25285
> c(var(Z), (1-p)/4)
[1] 0.1680012 0.1666667

và một cốt truyện QQ gần với Gaussian

qqnorm(Z)

nhập mô tả hình ảnh ở đây


1
@MichaelM: Cảm ơn những bình luận đó. Tôi đã bắt đầu với không âm tính, nhưng tôi nghĩ rằng hành vi tiệm cận trực quan mà bạn mô tả cho phép khái quát hóa cho nhiều bản phân phối hơn. Điều ngạc nhiên của tôi là (a) phương sai của căn bậc hai của tổng dường như có xu hướng không đổi không phụ thuộc vào và (b) sự xuất hiện của một phân phối trông rất gần với Gaussian. Một ví dụ ngược lại sẽ được hoan nghênh, nhưng khi tôi thử các trường hợp khác ban đầu có vẻ không phải là Gaussian, việc tăng thêm dường như sẽ đưa phân phối trở lại kết quả kiểu CLT. Xinn
Henry

Một hệ quả của điều này là bình phương trung bình gốc (hay trung bình bậc hai) của các biến ngẫu nhiên iid được chia tỷ lệ phù hợp (nhân với như với một trung bình số học) cũng hội tụ vào phân bố Gaussian với điều kiện là giây thứ của phân phối cơ bản là hữu hạn. n4
Henry

3
Chỉ cần một nhận xét ngắn: yêu cầu là một trường hợp đặc biệt của phương pháp Delta, xem Định lý 5.5.24 trong cuốn sách "Suy luận thống kê" của Casella & Berger.
Michael M

@Michael: Có lẽ bạn thấy một cái gì đó mà tôi không phải lúc này, nhưng tôi không nghĩ vấn đề đặc biệt này phù hợp với các giả định của phương pháp Delta cổ điển (ví dụ, như đã nêu trong định lý mà bạn tham khảo). Lưu ý rằng không hội tụ trong phân phối (không cần thiết trên ) và do đó "áp dụng phương thức Delta với " không thỏa mãn các yêu cầu cần thiết. Tuy nhiên, như câu trả lời của S. Catterall chứng minh, nó cung cấp một heuristic hữu ích dẫn đến câu trả lời đúng. YRg(y)=|y|
Đức hồng y

(Tôi tin rằng bạn có thể điều chỉnh bằng chứng của phương pháp Delta cho các trường hợp tương tự như trên để thực hiện đầy đủ nghiêm ngặt các heuristic đã nói ở trên.)
Hồng y

Câu trả lời:


14

Sự hội tụ đến một Gaussian thực sự là một hiện tượng chung.

Giả sử là các biến ngẫu nhiên IID có nghĩa là và phương sai và xác định tổng . Sửa một số . Định lý giới hạn trung tâm thông thường cho chúng ta biết rằng là , trong đó là tiêu chuẩn cdf bình thường. Tuy nhiên, tính liên tục của cdf giới hạn ngụ ý rằng chúng ta cũng cóX1,X2,X3,...μ>0σ2Yn=i=1nXiαP(Ynnμσnα)Φ(α)nΦ

P(Ynnμσnα+α2σ24μσn)Φ(α)
bởi vì thuật ngữ bổ sung ở phía bên phải của bất đẳng thức có xu hướng bằng không. Sắp xếp lại biểu thức này dẫn đến
P(Yn(ασ2μ+nμ)2)Φ(α)

Lấy căn bậc hai và lưu ý rằng ngụ ý rằng , chúng ta thu được Nói cách khác, . Kết quả này cho thấy sự hội tụ đến một Gaussian trong giới hạn là .μ>0P(Yn<0)0

P(|Yn|ασ2μ+nμ)Φ(α)
|Yn|nμσ/2μdN(0,1)n

Điều này có nghĩa là là một xấp xỉ tốt với cho lớn ? Vâng, chúng ta có thể làm tốt hơn thế này. Như @Henry lưu ý, giả sử mọi thứ đều tích cực, chúng ta có thể sử dụng , cùng với và xấp xỉ , để có được xấp xỉ cải thiện như đã nêu trong câu hỏi trên. Cũng lưu ý rằng chúng ta vẫn có vìnμE[|Yn|]nE[Yn]=E[Yn]Var(Yn)E[Yn]=nμVar(Yn)σ24μE[|Yn|]nμσ24μ

|Yn|nμσ24μσ/2μdN(0,1)
nμσ24μnμ0 dưới dạng .n

Bạn có thể cần thêm dưới dạng để nhận kết quả của tôinμnμσ24μ0n
Henry

@Henry Bạn có thể thay thế bằng cho mọi hằng số và điều này sẽ không thay đổi phân phối giới hạn, nhưng nó có thể thay đổi mức độ là một xấp xỉ tốt với cho lớn cụ thể . Làm thế nào bạn tìm ra ? nμnμkk|Yn|nμkσ/2μN(0,1)nnμσ24μ
S. Catterall phục hồi lại

Chúng tôi có nên . Giả sử mọi thứ đều tích cực, trong khi mẫu số của đề xuất và kết hợp các dẫn này với . Var(Z)=E[Z2](E[Z])2E[Z]=E[Z2]Var(Z)E[Z2]=E[Y]=nμ|Yn|nμσ/2μ E[Z]Var(Z)σ24μE[Z]nμσ24μ
Henry

Ok, cảm ơn, tôi đã cố gắng bao gồm điều này trong câu trả lời của tôi bây giờ.
S. Catterall phục hồi lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.