Tôi sẽ thúc đẩy điều này bằng trực giác và chỉ ra cách nó xảy ra đối với trường hợp đặc biệt của hai nhóm, giả sử bạn rất vui khi chấp nhận xấp xỉ bình thường cho nhị thức.
Hy vọng rằng điều đó sẽ đủ để bạn hiểu được lý do tại sao nó hoạt động theo cách nó làm.
Bạn đang nói về sự tốt đẹp chi bình phương của bài kiểm tra phù hợp. Giả sử có nhóm (bạn có nó là n , nhưng có một lý do tôi có xu hướng thích gọi nó là kknk ).
Trong mô hình đang được áp dụng cho tình huống này, các số , i = 1 , 2 , . . . , k là đa thức .ÔiTôii = 1 , 2 , . . . , k
Hãy để . Tổng số được quy định trên tổng N (ngoại trừ trong một số tình huống khá hiếm); và có một số thiết lập được xác định trước các xác suất cho mỗi thể loại, p i , i = 1 , 2 , ... , k , mà số tiền để 1N= ∑ki = 1ÔiTôiNpTôi, I = 1 , 2 , ... , k1 .
Cũng giống như với nhị thức, có một xấp xỉ bình thường không có triệu chứng cho đa thức - thực sự, nếu bạn chỉ xem xét số đếm trong một ô đã cho ("trong thể loại này" hay không), thì đó sẽ là nhị thức. Cũng giống như với nhị thức, phương sai của các số đếm (cũng như hiệp phương sai của chúng trong đa thức) là các hàm của và p 's; bạn không ước tính một phương sai riêng.Np
Nghĩa là, nếu số lượng dự kiến đủ lớn, vectơ của số lượng xấp xỉ bình thường với trung bình . Tuy nhiên, vì các số đếm được điều hòa trên N , phân phối bị suy biến (nó tồn tại trong một siêu phẳng có kích thước k - 1 , do chỉ định k - 1 trong số các số đếm cố định số còn lại). Ma trận phương sai hiệp phương sai có các mục chéo N p i ( 1 - p i ) và các phần tử đường chéo - N p i p jETôi= NpTôiNk - 1k - 1NpTôi( 1 - pTôi)- NpTôipj, và nó thuộc hạng vì sự thoái hóa.k - 1
Kết quả là, đối với một ô riêng lẻ và bạn có thể viết z i = O i - E iVar ( OTôi) = NpTôi( 1 - pTôi) . Tuy nhiên, các từ ngữ phụ thuộc (tỷ lệ nghịch), vì vậy nếu bạn tổng hợp các ô vuông của nhữngzinó sẽ không có mộtχ2kphân phối (như nó sẽ nếu họ đã biến tiêu chuẩn độc lập). Thay vào đó, chúng ta có khả năng có thể xây dựng một tập hợp cácbiến độc lậpk-1từkban đầuđộc lập và vẫn xấp xỉ bình thường (bình thường không có triệu chứng). Nếu chúng ta tóm tắtcủa họvuông (chuẩn), chúng tôi muốn có được mộtχ2k-1zTôi= OTôi- ETôiETôi( 1 - pTôi)√zTôiχ2kk - 1kχ2k - 1. Có nhiều cách để xây dựng một tập hợp các biến như vậy một cách rõ ràng, nhưng may mắn thay, có một lối tắt rất gọn gàng để tránh những gì đáng kể cho một lượng lớn nỗ lực và mang lại kết quả tương tự (cùng giá trị của thống kê) như thể chúng ta đã có đi đến rắc rối.k - 1
Hãy xem xét, để đơn giản, một sự phù hợp với hai loại (hiện là nhị thức). Xác suất tồn tại trong ô thứ nhất là và trong ô thứ hai là p 2 = 1 - p . Có các quan sát X = O 1 trong ô thứ nhất và N - X = O 2 trong ô thứ hai.p1= pp2= 1 - pX= O1N- X= O2
Số lượng tế bào đầu tiên quan sát được, có triệu chứng N ( N p , N p ( 1 - p ) ) . Chúng ta có thể tiêu chuẩn hóa nó là z = X - N pXN ( Np , Np ( 1 - p ) ) . Khi đóz2=(X-Np)2z= X- NpNp ( 1 - p )√ là khoảng~χ 2 1 (tiệm~χ 2 1 ).z2= ( X- Np )2Np ( 1 - p )∼ χ21∼ χ21
Thông báo rằng
.Σ2i = 1( ÔTôi- ETôi)2ETôi= [ X- Np ]2Np+ [ ( N- X) - ( N- Np ) ]2N( 1 - p )= [ X- Np ]2Np+ [ X- Np]2N( 1 - p )= =( X- Np)2[ 1Np+ 1N( 1 - p )]
Nhưng
.1Np+ 1N( 1 - p )= =Np + N( 1 - p )Ntr .N( 1 - p )= 1Np ( 1 - p )
Vậy làzΣ2i = 1( ÔTôi- ETôi)2ETôi= (X-Np )2Np ( 1 - p ) mà chúng ta đã bắt đầu - mà không có triệu chứng sẽ làbiến ngẫu nhiên χ 2 1 . Sự phụ thuộc giữa hai ô sao cho bằng cách lặn bằng E i thay vì E i ( 1 - p i ), chúng tôi bù chính xác cho sự phụ thuộc giữa hai ô và lấy biến ngẫu nhiên bình phương ban đầu xấp xỉ bình thường.z2χ21ETôiETôi( 1 - pTôi)
Cùng một kiểu phụ thuộc tổng được quan tâm theo cùng một cách tiếp cận khi có nhiều hơn hai loại - bằng cách tóm thay vì(Oi-Ei)2( ÔTôi- ETôi)2ETôi trên tất cả cácđiều khoảnk, bạn bù chính xác cho hiệu ứng của sự phụ thuộc và có được một số tiền tương đương với tổng củak-1 quy tắcđộc lập.( ÔTôi- ETôi)2ETôi( 1 - pTôi)kk - 1
χ2k - 1k