Câu trả lời nhanh
Lý do là vì, giả sử dữ liệu là iid và , và xác định
ˉ XXi∼N(μ,σ2)
khi hình thành khoảng tin cậy, sự phân bố lấy mẫu kết hợp với phương sai mẫu (S2!, Hãy nhớ, một biến ngẫu nhiên) là một phân phối chi-vuông (S2(N-1)/σ2~χ2n-1), cũng giống như sự phân bố lấy mẫu gắn liền với giá trị trung bình mẫu là một phân phối chuẩn chuẩn ((ˉX-μ)√
X¯S2==∑NXiN∑N(X¯-XTôi)2N- 1
S2S2( N- 1 ) / σ2∼ χ2n - 1) khi bạn biết phương sai, và với một t-sinh viên khi bạn không (
( ˉ X -μ) √( X¯−μ)n−−√/σ∼Z(0,1) ).
(X¯−μ)n−−√/S∼Tn−1
Câu trả lời dài
Trước hết, chúng tôi sẽ chứng minh rằng tuân theo phân phối chi-vuông với N - 1 bậc tự do. Sau đó, chúng ta sẽ thấy bằng chứng này hữu ích như thế nào khi rút ra các khoảng tin cậy cho phương sai và cách phân phối chi bình phương xuất hiện (và tại sao nó lại hữu ích như vậy!). Hãy bắt đầu nào.S2(N−1)/σ2N−1
Bằng chứng
Đối với điều này, có lẽ bạn phải làm quen với phân phối chi bình phương trong bài viết Wikipedia này . Phân phối này chỉ có một tham số: mức độ tự do, , và sẽ xảy ra để có một Moment Tạo Function (MGF) cho bởi:
m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 .
Nếu chúng ta có thể thấy rằng sự phân bố của S 2 ( N - 1 ) / σ 2 có chức năng tạo ra khoảnh khắc như thế này, nhưng với ν =ν
mχ2ν(t)=(1−2t)−ν/2.
S2(N−1)/σ2 , sau đó chúng tôi đã chỉ ra rằng
S 2 ( N - 1 ) / σ 2 tuân theo phân phối chi-vuông với
N - 1 bậc tự do. Để hiển thị điều này, lưu ý hai sự thật:
ν=N−1S2(N−1)/σ2N−1
Nếu chúng ta định nghĩa,
nơiZi~N(0,1), tức là, tiêu chuẩn các biến ngẫu nhiên bình thường, chức năng tạo ra khoảnh khắc củaYđược cho bởi
m Y (t)
Y=∑(Xi−X¯)2σ2=∑Z2i,
Zi∼N(0,1)Y
MGF củaZ2được cho bởi
m Z 2 ( t )mY(t)===E[etY]E[etZ21]×E[etZ22]×...E[etZ2N]mZ2i(t)×mZ22(t)×...mZ2N(t).
Z2
nơi mà tôi đã sử dụng PDF của tiêu chuẩn bình thường,f(z)=e- z 2 / 2/√mZ2(t)==∫∞−∞f(z)exp(tz2)dz(1−2t)−1/2,
và, do đó,
mY(t)=(1-2t) - N / 2 ,
màngụ ý rằngYtuân theo phân phối chi-vuông vớiNbậc tự do.f(z)=e−z2/2/2π−−√mY(t)=(1−2t)−N/2,
YN
Nếu và Y 2 là độc lập và mỗi phân phối như một bản phân phối chi-square nhưng với ν 1 và ν 2 bậc tự do, sau đó W = Y 1 + Y 2 phân phối với một phân phối chi-vuông với ν 1 + ν 2 độ tự do (điều này xuất phát từ việc lấy MGF của W ; làm điều này!).Y1Y2ν1ν2W=Y1+Y2ν1+ν2W
Với những sự kiện trên, lưu ý rằng nếu bạn nhân phương sai mẫu bằng , bạn có được (sau khi một số đại số),
( N - 1 ) S 2 = - n ( ˉ X - μ ) + Σ ( X i - μ ) 2 ,
và, do đó, chia cho σ 2 ,
( N - 1 ) S 2N−1
(N−1)S2=−n(X¯−μ)+∑(Xi−μ)2,
σ2
Lưu ý rằng thuật ngữ thứ hai ở bên trái của tổng này phân phối dưới dạng phân phối chi bình phương với 1 bậc tự do và tổng bên phải phân phối dưới dạng bình phương chi với
Nbậc tự do.
Do đó,S2(N-1)/σ2phân phối như một chi-vuông vớiN-1bậc tự do.
(N−1)S2σ2+(X¯−μ)2σ2/N=∑(Xi−μ)2σ2.
NS2(N−1)/σ2N−1
Tính khoảng tin cậy cho phương sai.
Khi tìm kiếm một khoảng tin cậy cho phương sai, bạn muốn biết các giới hạn và L 2 trong
P ( L 1 ≤ σ 2 ≤ L 2 ) = 1 - α .
Hãy chơi với sự bất bình đẳng trong ngoặc đơn. Đầu tiên, chia cho S 2 ( N - 1 ) ,
L 1L1L2
P(L1≤σ2≤L2)=1−α.
S2(N−1)
Và sau đó nhớ hai điều: (1) các số liệu thống kê
S2(N-1)/σ2có phân phối chi-squared với
N-1bậc tự do và (2) các phương sai luôn greather hơn không là, mà ngụ ý rằng bạn có thể đảo ngược các bất đẳng thức, vì
L 1L1S2(N−1)≤σ2S2(N−1)≤L2S2(N−1).
S2(N−1)/σ2N−1L1S2(N−1)≤σ2S2(N−1)σ2S2(N−1)≤L2S2(N−1)⇒⇒S2(N−1)σ2≤S2(N−1)L1,S2(N−1)L2≤S2(N−1)σ2,
hence, the probability we are looking for is:
P(S2(N−1)L2≤S2(N−1)σ2≤S2(N−1)L1)=1−α.
Note that
S2(N−1)/σ2∼χ2(N−1). We want then,
∫N−1S2(N−1)L2pχ2(x)dx∫S2(N−1)L1N−1pχ2(x)dx==(1−α)/2 ,(1−α)/2
(we integrate up to
N−1 because the expected value of a chi-squared random variable with
N−1 degrees of freedom is
N−1) or, equivalently,
∫S2(N−1)L20pχ2(x)dx=α/2,∫∞S2(N−1)L1pχ2(x)dx=α/2.
Calling
χ2α/2=S2(N−1)L2 and
χ21−α/2=S2(N−1)L1, where the values
χ2α/2 and
χ21−α/2 can be found in chi-square tables (in computers mainly!) and solving for
L1 and
L2,
L1L2==S2(N−1)χ21−α/2,S2(N−1)χ2α/2.
Hence, your confidence interval for the variance is
C.I.=(S2(N−1)χ21−α/2,S2(N−1)χ2α/2).