Hãy xử lý trường hợp đơn giản nhất để cố gắng cung cấp trực giác nhất. Hãy để là một mẫu iid từ một phân phối rời rạc với k kết quả. Hãy π 1 , ... , π k là xác suất của từng kết quả cụ thể. Chúng tôi đang quan tâm trong (tiệm cận) phân phối chi-squared Thống kê
X 2 = k Σ i = 1 ( S trong π i ) 2X1, X2, Lọ , Xnkπ1, ... , πk
Ở đây n π i là số đếm dự kiến củakết quả thứ i .
X2= ∑i = 1k( STôi- n πTôi)2n πTôi.
n πTôiTôi
Một heuristic gợi ý
Xác định , sao choX2=∑iU 2 i =‖U‖ 2 2 trong đó.BạnTôi= ( STôi- n πTôi) / n πTôi---√X2= ∑TôiBạn2Tôi= ∥ U ∥22U =( U1, ... , Uk)
Vì là , nên theo Định lý giới hạn trung tâm ,
do đó, chúng ta cũng có điều đó, .B i n ( n , π i ) T i = U iSTôiB i n (n, πTôi)U i d → N ( 0 , 1 - π i )
TTôi= UTôi1 - πTôi-----√= STôi- n πTôin πTôi( 1 - πTôi)---------√→dN( 0 , 1 ),
BạnTôi→dN( 0 , 1 - πTôi)
Bây giờ, nếu các là (tiệm cận) độc lập (mà họ không), thì chúng ta có thể tranh luận rằng
được tiệm phân phối. Nhưng, lưu ý rằng là một hàm xác định của và do đó các biến không thể độc lập.∑ i T 2 i χ 2 k T k ( T 1 , Rời , T k - 1 ) T iTTôiΣTôiT2Tôiχ2kTk( T1, Lọ , Tk - 1)TTôi
Do đó, chúng ta phải tính đến hiệp phương sai giữa chúng bằng cách nào đó. Hóa ra, cách "chính xác" để làm điều này là sử dụng thay vào đó và hiệp phương sai giữa các thành phần của cũng thay đổi phân phối tiệm cận từ những gì chúng ta có thể nghĩ là thành , trên thực tế, a .U χ 2 k χ 2 k - 1BạnTôiBạnχ2kχ2k - 1
Một số chi tiết về điều này theo sau.
Một điều trị nghiêm ngặt hơn
Trên thực tế, không khó để kiểm tra xem,
cho . i≠jC o v ( UTôi, Uj) = - πTôiπj----√tôi ≠ j
Vì vậy, hiệp phương sai của là
trong đó . Lưu ý rằng
là đối xứng và idempotent, tức là, . Vì vậy, đặc biệt, nếu có iid các thành phần thông thường tiêu chuẩn, thì . ( NB Phân phối chuẩn nhiều biến số trong trường hợp này là suy biến .)Một = Tôi - √Bạn√
A = I - π--√π--√T,
MộtMột=Một2=ATZ=(Z1,...,Zk)MộtZ~N(0,A)π--√= ( π1--√, ... , πk--√)MộtA = A2= ATZ =( Z1, ... , Zk)Một Z ~ N( 0 , A )
Bây giờ, bởi đa biến Trung Định lý giới hạn , vector có phân phối chuẩn nhiều chiều tiệm cận với trung bình và phương sai . 0 ABạn0Một
Vì vậy, có phân phối tiệm cận giống như , do đó, phân phối tiệm cận giống nhau của
giống như phân phối của theo định lý ánh xạ liên tục .A Z X 2 = U T U Z T A T A Z = Z T A ZBạnMột chữ ZX2= UTBạnZTMộtTA Z = ZTMột chữ Z
Nhưng, là đối xứng và không có giá trị, vì vậy ( a ) nó có các hàm riêng trực giao, ( b ) tất cả các giá trị riêng của nó là 0 hoặc 1, và ( c ) bội số của giá trị riêng của 1 là . Điều này có nghĩa là có thể được phân tách thành trong đó là trực giao và là ma trận đường chéo có trên đường chéo và các mục chéo còn lại bằng không.Mộtr a n k ( A )MộtA = Q D QTQDr a n k ( A )
Do đó, phải là phân phối vì
có thứ hạng trong trường hợp của chúng tôi.ZTMột chữ Zχ2k - 1Mộtk - 1
Các kết nối khác
Thống kê chi bình phương cũng liên quan chặt chẽ với thống kê tỷ lệ khả năng. Thật vậy, nó là một thống kê điểm Rao và có thể được xem như là một xấp xỉ chuỗi Taylor về thống kê tỷ lệ khả năng.
Người giới thiệu
Đây là sự phát triển của riêng tôi dựa trên kinh nghiệm, nhưng rõ ràng bị ảnh hưởng bởi các văn bản cổ điển. Những nơi tốt để tìm hiểu thêm là
- GAF Seber và AJ Lee (2003), Phân tích hồi quy tuyến tính , tái bản lần 2, Wiley.
- E. Lehmann và J. Romano (2005), Thử nghiệm các giả thuyết thống kê , tái bản lần thứ 3, Springer. Mục 14.3 nói riêng.
- DR Cox và DV Hinkley (1979), Thống kê lý thuyết , Chapman và Hội trường.