Làm thế nào để thống kê Chi bình phương của Pearson xấp xỉ một phân phối Chi bình phương


10

Vì vậy, nếu Thống kê Chi bình phương của Pearson được đưa ra cho bảng , thì hình thức của nó là:1×N

i=1n(OiEi)2Ei

Sau đó, giá trị này xấp xỉ , Phân phối Chi bình phương với n - 1 độ tự do, như cỡ mẫu Nχn12n1N trở nên lớn hơn.

Những gì tôi không hiểu là làm thế nào gần đúng tiệm cận này hoạt động. Tôi cảm thấy như 's trong mẫu số nên được thay thế bằng s 2 iEi . Vì điều đó sẽ cho bạnχ 2 n = n i = 1 Z 2 i , vớiZin(0,1). Nhưng tất nhiên điều này cónbậc tự do, không phảin-1, vì vậy rõ ràng có điều gì đó khác đang diễn ra.STôi2nTôiχn2= =ΣTôi= =1nZTôi2ZTôi~n(0,1)nn-1


Mặc dù điều này không trả lời câu hỏi của bạn , nhưng nó có thể làm sáng tỏ nó.
whuber

Câu trả lời:


11

Tôi sẽ thúc đẩy điều này bằng trực giác và chỉ ra cách nó xảy ra đối với trường hợp đặc biệt của hai nhóm, giả sử bạn rất vui khi chấp nhận xấp xỉ bình thường cho nhị thức.

Hy vọng rằng điều đó sẽ đủ để bạn hiểu được lý do tại sao nó hoạt động theo cách nó làm.

Bạn đang nói về sự tốt đẹp chi bình phương của bài kiểm tra phù hợp. Giả sử có nhóm (bạn có nó là n , nhưng có một lý do tôi có xu hướng thích gọi nó là kknk ).

Trong mô hình đang được áp dụng cho tình huống này, các số , i = 1 , 2 , . . . , kđa thức .ÔiTôiTôi= =1,2,...,k

Hãy để . Tổng số được quy định trên tổng N (ngoại trừ trong một số tình huống khá hiếm); và có một số thiết lập được xác định trước các xác suất cho mỗi thể loại, p i , i = 1 , 2 , ... , k , mà số tiền để 1N= =ΣTôi= =1kÔiTôiNpTôi,Tôi= =1,2,Giáo dục,k1 .

Cũng giống như với nhị thức, có một xấp xỉ bình thường không có triệu chứng cho đa thức - thực sự, nếu bạn chỉ xem xét số đếm trong một ô đã cho ("trong thể loại này" hay không), thì đó sẽ là nhị thức. Cũng giống như với nhị thức, phương sai của các số đếm (cũng như hiệp phương sai của chúng trong đa thức) là các hàm của p 's; bạn không ước tính một phương sai riêng.Np

Nghĩa là, nếu số lượng dự kiến ​​đủ lớn, vectơ của số lượng xấp xỉ bình thường với trung bình . Tuy nhiên, vì các số đếm được điều hòa trên N , phân phối bị suy biến (nó tồn tại trong một siêu phẳng có kích thước k - 1 , do chỉ định k - 1 trong số các số đếm cố định số còn lại). Ma trận phương sai hiệp phương sai có các mục chéo N p i ( 1 - p i ) và các phần tử đường chéo - N p i p jETôi= =NpTôiNk-1k-1NpTôi(1-pTôi)-NpTôipj, và nó thuộc hạng vì sự thoái hóa.k-1

Kết quả là, đối với một ô riêng lẻ và bạn có thể viết z i = O i - E iVar(ÔiTôi)= =NpTôi(1-pTôi) . Tuy nhiên, các từ ngữ phụ thuộc (tỷ lệ nghịch), vì vậy nếu bạn tổng hợp các ô vuông của nhữngzinó sẽ không có mộtχ2kphân phối (như nó sẽ nếu họ đã biến tiêu chuẩn độc lập). Thay vào đó, chúng ta có khả năng có thể xây dựng một tập hợp cácbiến độc lậpk-1từkban đầuđộc lập và vẫn xấp xỉ bình thường (bình thường không có triệu chứng). Nếu chúng ta tóm tắtcủa họvuông (chuẩn), chúng tôi muốn có được mộtχ2k-1zTôi= =ÔiTôi-ETôiETôi(1-pTôi)zTôiχk2k-1kχk-12. Có nhiều cách để xây dựng một tập hợp các biến như vậy một cách rõ ràng, nhưng may mắn thay, có một lối tắt rất gọn gàng để tránh những gì đáng kể cho một lượng lớn nỗ lực và mang lại kết quả tương tự (cùng giá trị của thống kê) như thể chúng ta đã có đi đến rắc rối.k-1

Hãy xem xét, để đơn giản, một sự phù hợp với hai loại (hiện là nhị thức). Xác suất tồn tại trong ô thứ nhất là và trong ô thứ hai là p 2 = 1 - p . Có các quan sát X = O 1 trong ô thứ nhất và N - X = O 2 trong ô thứ hai.p1= =pp2= =1-pX= =Ôi1N-X= =Ôi2

Số lượng tế bào đầu tiên quan sát được, có triệu chứng N ( N p , N p ( 1 - p ) ) . Chúng ta có thể tiêu chuẩn hóa nó là z = X - N pXN(Np,Np(1-p)) . Khi đóz2=(X-Np)2z= =X-NpNp(1-p) là khoảng~χ 2 1 (tiệm~χ 2 1 ).z2= =(X-Np)2Np(1-p)~χ12~χ12

Thông báo rằng

.ΣTôi= =12(ÔiTôi-ETôi)2ETôi= =[X-Np]2Np+[(N-X)-(N-Np)]2N(1-p)= =[X-Np]2Np+[X-Np]2N(1-p)= =(X-Np)2[1Np+1N(1-p)]

Nhưng

.1Np+1N(1-p)= =Np+N(1-p)Np.N(1-p)= =1Np(1-p)

Vậy zΣTôi= =12(ÔiTôi-ETôi)2ETôi= =(X-Np)2Np(1-p) mà chúng ta đã bắt đầu - mà không có triệu chứng sẽ làbiến ngẫu nhiên χ 2 1 . Sự phụ thuộc giữa hai ô sao cho bằng cách lặn bằng E i thay vì E i ( 1 - p i ), chúng tôi bù chính xác cho sự phụ thuộc giữa hai ô và lấy biến ngẫu nhiên bình phương ban đầu xấp xỉ bình thường.z2χ12ETôiETôi(1-pTôi)

Cùng một kiểu phụ thuộc tổng được quan tâm theo cùng một cách tiếp cận khi có nhiều hơn hai loại - bằng cách tóm thay vì(Oi-Ei)2(ÔiTôi-ETôi)2ETôi trên tất cả cácđiều khoảnk, bạn bù chính xác cho hiệu ứng của sự phụ thuộc và có được một số tiền tương đương với tổng củak-1 quy tắcđộc lập.(ÔiTôi-ETôi)2ETôi(1-pTôi)kk-1

χk-12k


Cảm ơn, điều này có ý nghĩa. Đây có phải là một cái gì đó của một sự trùng hợp ngẫu nhiên / tai nạn toán học mà nó hoạt động rất độc đáo để chỉ được chia theo giá trị mong đợi? hoặc có một giải thích thống kê trực quan tại sao điều này nên là trường hợp.
Thoth

Có một số giải thích có thể có hoặc không trực quan, tùy thuộc vào những điều khác nhau giữa mỗi người. Ví dụ: nếu số lượng quan sát ban đầu là các biến Poisson độc lập, thì phương sai của thực sự sẽ khiến bạn chia chozETôi

(ctd) ... Do đó, bạn nên chia cho ETôik-1

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.