Khoảng tin cậy cho phương sai cho một quan sát


25

Đây là một vấn đề từ "Olympic sinh viên Kolmogorov lần thứ 7 về lý thuyết xác suất":

Với một quan sát X từ một Normal(μ,σ2) phân phối với cả hai tham số chưa biết, cho một khoảng tin cậy cho σ2 với mức độ tin cậy của ít nhất 99%.

Dường như với tôi rằng điều này là không thể. Tôi có giải pháp, nhưng chưa đọc nó. Có suy nghĩ gì không?

Tôi sẽ đăng giải pháp trong một vài ngày.

[Chỉnh sửa tiếp theo: Giải pháp chính thức được đăng dưới đây. Giải pháp của Cardinal dài hơn, nhưng cho khoảng tin cậy tốt hơn. Cũng xin cảm ơn Max và Glen_b cho đầu vào của họ.]


1
Có vẻ như không thể đối với tôi, quá; Tôi đang chờ câu trả lời
Peter Flom - Tái lập Monica

1
Kiểm tra trang web này .
giả định

3
Đây là một bài báo có định dạng tốt hơn: giấy .
giả định

Heh. Tôi nhớ đã đọc một bài báo về công cụ này (một khoảng thời gian quan sát) nhiều năm trước. Có thể đã được này một.
Glen_b -Reinstate Monica

1
@Max, cảm ơn vì đường link! Tôi chưa có thời gian để xem xét kỹ về nó, nhưng tôi sẽ làm. Tôi đã đăng câu trả lời "chính thức" dưới đây.
Jonathan Christensen

Câu trả lời:


17

Nhìn qua lăng kính của sự bất bình đẳng xác suất và các kết nối với trường hợp đa quan sát, kết quả này có vẻ không phải là không thể, hoặc, ít nhất, nó có vẻ hợp lý hơn.

Hãy với μσ 2 chưa biết. Chúng ta có thể viết X = σ Z + μ cho Z N ( 0 , 1 ) .XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Khiếu nại chính : là khoảng tin cậy ( 1 - α ) cho σ 2 trong đó q α là lượng tử α -level của phân phối chi bình phương với một bậc tự do. Hơn nữa, kể từ khoảng thời gian này có chính xác ( 1 - α ) bảo hiểm khi μ = 0 , nó là khoảng thời gian có thể hẹp nhất có dạng [ 0 , b X đối với một số b[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)bR .

Một lý do cho sự lạc quan

Nhớ lại rằng trong trường hợp, với T = Σ n i = 1 ( X i - ˉ X ) 2 , các điển hình ( 1 - α ) Khoảng tin cậy cho σ 2( Tn2T=i=1n(XiX¯)2 (1α)σ2 trong đó q k , a là lượng tử a -level của một bình phương với k bậc tự do. Điều này, tất nhiên, giữ cho bất kỳ μ . Mặc dù đây làkhoảngphổ biến nhất(được gọi là khoảng thời gianbằng nhauvì những lý do rõ ràng), nó không phải là khoảng duy nhất và thậm chí không phải là chiều rộng nhỏ nhất! Rõ ràng, một lựa chọn hợp lệ khác là ( 0 , T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Kể từ đó, , sau đó ( 0 , Σ n i = 1 X 2 iTi=1nXi2 cũng có phạm vi bảo hiểm ít nhất ( 1 - α ) .

(0,i=1nXi2qn1,α),
(1α)

Nhìn dưới ánh sáng này, chúng ta có thể lạc quan rằng khoảng thời gian trong yêu cầu chính là đúng với . Sự khác biệt chính là không có phân phối chi bình phương không bậc tự do cho trường hợp quan sát đơn lẻ, vì vậy chúng ta phải hy vọng rằng việc sử dụng định lượng một bậc tự do sẽ hoạt động.n=1

Một nửa bước về phía đích của chúng tôi ( Khai thác đuôi phải )

Trước khi đi sâu vào một bằng chứng về yêu cầu chính, trước tiên chúng ta hãy xem xét một tuyên bố sơ bộ gần như không mạnh mẽ hoặc thỏa mãn về mặt thống kê, nhưng có lẽ cung cấp thêm một số hiểu biết sâu sắc về những gì đang diễn ra. Bạn có thể bỏ qua bằng chứng về yêu cầu chính bên dưới, mà không mất nhiều (nếu có). Trong phần này và phần tiếp theo, các bằng chứng trong khi một chút tinh tế chỉ dựa trên các sự kiện cơ bản: tính đơn điệu của xác suất, tính đối xứng và tính không đồng nhất của phân phối chuẩn.

Phụ tuyên bố : là một ( 1 - α ) Khoảng tin cậy cho σ 2 càng lâu càng α > 1 / 2 . Ở đây z α là lượng tử α -level của một chuẩn thông thường.[0,X2/zα2)(1α)σ2α>1/2zαα

Bằng chứng . | σ Z + L | d = | - σ Z + L | bởi đối xứng, vì vậy trong những gì sau chúng ta có thể lấy L 0 mà không mất tính tổng quát. Bây giờ, đối với θ 0L 0 , P ( | X | > θ ) P ( X > θ )|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0 Và như vậy với θ = z α σ , chúng ta thấy rằng P ( 0 σ 2 < X 2 / z 2 α ) 1 - α

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασ Này chỉ hoạt động đối với α > 1 / 2 , vì đó là những gì cần thiết cho z α > 0 .
P(0σ2<X2/zα2)1α.
α>1/2zα>0

Điều này chứng tỏ yêu cầu phụ trợ. Trong khi minh họa, nó là unsatifying từ góc độ thống kê vì nó đòi hỏi một ngớ ngẩn lớn lại làm việc.α

Chứng minh yêu cầu chính

Một sàng lọc của các đối số trên dẫn đến một kết quả sẽ làm việc cho một mức độ tin cậy tùy ý. Đầu tiên, lưu ý rằng Set một = μ / σ 0 b = θ / σ 0 . Khi đó, P ( | Z + a | > b ) = Φ ( a - b ) + Φ ( - a - b )

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0 Nếu chúng ta có thể chỉ ra rằng phía bên tay phải tăng theo a cho mỗi b cố định, thì chúng ta có thể sử dụng một đối số tương tự như trong đối số trước. Điều này ít nhất là hợp lý, vì chúng tôi muốn tin rằng nếu giá trị trung bình tăng, thì có khả năng cao hơn là chúng ta thấy một giá trị có mô đun vượt quá b . (Tuy nhiên, chúng ta phải coi chừng khối lượng giảm nhanh ở đuôi bên trái!)
P(|Z+a|>b)=Φ(ab)+Φ(ab).
mộtbb

Set . Khi đó f b ( a ) = φ ( a - b ) - φ ( - a - b ) = φ ( a - b ) - φ ( a + b )fb(một)= =Φ(một-b)+Φ(-một-b) Lưu ý rằng f b ( 0 ) = 0 và đối với u dương, φ ( u ) đang giảm theo u . Bây giờ, đối với một ( 0 , 2 b ) , nó rất dễ dàng để thấy rằng φ ( một - b ) φ ( - b ) = φ ( b ) . Những sự kiện này được thực hiện cùng nhau dễ dàng ngụ ý rằng f b ( a

fb'(một)= =φ(một-b)-φ(-một-b)= =φ(một-b)-φ(một+b).
fb'(0)= =0bạnφ(bạn)bạnmột(0,2b)φ(ab)φ(b)=φ(b) cho tất cả một 0 và bất kỳ cố định b 0 .
fb(a)0
a0b0

Do đó, chúng tôi đã chỉ ra rằng đối với b 0 , P ( | Z + một | > b ) P ( | Z | > b ) = 2 Φ ( - b )a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Làm sáng tỏ tất cả điều này, nếu chúng ta lấy θ=qασ

P(X2>qασ2)P(Z2>qα)= =1-α,

Nhận xét kết thúc : Việc đọc cẩn thận đối số trên cho thấy rằng nó chỉ sử dụng các thuộc tính đối xứng và không đối xứng của phân phối chuẩn. Do đó, cách tiếp cận hoạt động tương tự để có được khoảng tin cậy từ một quan sát duy nhất từ ​​bất kỳ gia đình quy mô vị trí không đối xứng nào, ví dụ, phân phối Cauchy hoặc Laplace.


Ồ và các sinh viên dự kiến ​​sẽ đưa ra loại tranh luận này trong thời gian ngắn của một kỳ thi Olympic?
Dilip Sarwate

1
@Dilip: Tôi không có ý kiến! Tôi không quen thuộc với định dạng của Olympic này hoặc những gì được mong đợi về mặt giải pháp. Từ một bài đọc theo nghĩa đen, tôi nghĩ câu trả lời của Scortchi sẽ được chấp nhận. Tôi đã quan tâm nhiều hơn đến việc cố gắng tìm hiểu xem người ta có thể đi được bao xa với giải pháp "không tầm thường". Cuộc thám hiểm của tôi (khá tối thiểu) theo cùng một dòng suy nghĩ được mô tả trong câu trả lời (với một đường vòng). Rất có khả năng tồn tại một giải pháp tốt hơn. :-)
hồng y

Thời gian này dài hơn đáng kể so với giải pháp "chính thức", nhưng nó mang lại sự ràng buộc tốt hơn về phương sai, vì vậy tôi đánh dấu nó là câu trả lời "chính xác". Tôi đã đăng câu trả lời "chính thức" bên dưới, cũng như một số kết quả mô phỏng và thảo luận. Cảm ơn, @cardinal!
Jonathan Christensen

2
@Jonathan: Cảm ơn. Vâng, tôi có thể đã làm cho bằng chứng khá ngắn gọn hơn một chút. Do phạm vi nền tảng rộng lớn của những người tham gia ở đây, tôi thường có xu hướng thưởng thức thêm chi tiết (hoặc, có lẽ, quá mức). :-)
hồng y

12

Thời gian để theo dõi! Đây là giải pháp tôi được đưa ra:

Chúng tôi sẽ xây dựng một khoảng tin cậy của mẫu [0,T(X)), Ở đâu T()là một số thống kê. Theo định nghĩa, đây sẽ là khoảng tin cậy với mức độ tin cậy ít nhất 99% nếu

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0,01.
Chúng tôi lưu ý rằng mật độ của N(μ,σ2) phân phối không vượt quá 1/σ2π. Vì thế,P(|X|một)một/σ Cho mọi một0. Nó theo đó
tP(|X|/σt)= =P(X2t2σ2)= =P(σ2X2/t2).
Cắm vào t= =0,01 chúng tôi có được rằng số liệu thống kê thích hợp là T(X)= =10000X2.

The confidence interval (which is very wide) is slightly conservative in simulation, with no empirical coverage (in 100,000 simulations) lower than 99.15% as I varied the CV over many orders of magnitude.

For comparison, I also simulated cardinal's confidence interval. I should note that cardinal's interval is quite a bit narrower--in the 99% case, his ends up being up to about 6300X2, as opposed to the 10000X2 in the provided solution. Empirical coverage is right at the nominal level, again over many orders of magnitude for the CV. So his interval definitely wins.

I haven't had time to look carefully at the paper Max posted, but I do plan to look at that and may add some comments regarding it later (i.e., no sooner than a week). That paper claims a 99% confidence interval of (0,4900X2), which has empirical coverage slightly lower (about 98.85%) than the nominal coverage for large CVs in my brief simulations.


1
(+1) That's a nice solution. Should you have t instead of t in the display equation?
cardinal

2
A couple more points: Your solution can be made to be very close to mine without any change in the argument. Note that you can claim that P(|X|a)2a/σ2π. Then the interval becomes (0,2X2/πα2) for any α. Using α=0.01 yields T(X)6366.198X2 versus the 1/q0.016365.864 in my answer. The higher the confidence level (i.e., the smaller the α), the closer your method compares to mine (though your interval will always be wider).
cardinal

1
Second, I have not looked at that paper, but I have strong doubts that (0,4900X2) can be a valid 99% confidence interval. Indeed, consider all confidence intervals of the form (0,bX2) for some b. Then, when μ=0, we have that X2/σ2 is exactly chi-squared with one degree of freedom and so the smallest b we could select in this instance is b=1/qα. In other words, the interval given in my answer is the narrowest possible of the stated form.
cardinal

1
I made the (suspected) typo correction. Also, pchisq(1/4900,1,lower.tail=F) in R returns 0.9886, quite close to your simulation results for the (0,4900X2) interval.
cardinal

1
Thanks for all the comments, @cardinal. I think your change is correct, though I typed it the way it was in the original solutions--typo there, I guess.
Jonathan Christensen

5

The CI's (0,) presumably.


1
I think it would be helpful for you to say why you can't get a finite length confidence interval.
assumednormal

1
@Max I'm not smart enough - but the question didn't ask for one.
Scortchi - Reinstate Monica

4
+1 for this. Question didn't say a CI with minimal coverage, and in fact implies that this might be acceptable through its curious wording, "a confidence interval with a confidence level of at least 99%."
Ari B. Friedman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.