Hiểu bài kiểm tra Chi bình phương và phân phối Chi bình phương


13

Tôi đang cố gắng để hiểu logic đằng sau bài kiểm tra chi bình phương.

Các thử nghiệm Chi-squared là χ2=(obsexp)2exp . χ2sau đó được so sánh với phân phối Chi bình phương để tìm ra p.value để từ chối hoặc không giả thuyết khống. H0: các quan sát đến từ phân phối mà chúng ta đã sử dụng để tạo ra các giá trị mong đợi của chúng tôi. Ví dụ, chúng tôi có thể kiểm tra xem xác suất lấy đượcheadđược đưa ra bởipnhư chúng tôi mong đợi. Vì vậy, chúng tôi lật 100 lần và tìmnH Heads1nH tails. Chúng tôi muốn so sánh kết quả của chúng tôi với những gì được mong đợi (100p). Chúng tôi cũng có thể sử dụng phân phối nhị thức nhưng đó không phải là điểm của câu hỏi Câu hỏi là:

Bạn có thể giải thích tại sao, theo giả thuyết null, theo phân phối chi bình phương?(obsexp)2exp

Tất cả những gì tôi biết về phân phối Chi bình phương là phân phối chi bình phương độ là tổng phân phối chuẩn k bình phương.kk


2
Nó không: đây là một xấp xỉ. (Nhiều) thêm về điều này xuất hiện trong chuỗi tại stats.stackexchange.com/questions/16921/iêu .
whuber

Điều này có thể chứng minh sự quan tâm của Karl Pearson và Bài kiểm tra Chi bình phương, (Plquet, 1983) {pdf}
Avraham

Một câu hỏi có liên quan về việc tại sao sự phân bố chi-squared được sử dụng cho sự tốt lành của các xét nghiệm phù hợp, mặc dù không hoàn toàn là một bản sao: stats.stackexchange.com/questions/125312/...
cá bạc

Câu trả lời:


12

Chúng tôi cũng có thể sử dụng phân phối nhị thức nhưng đó không phải là điểm của câu hỏi

Tuy nhiên, đó là điểm khởi đầu của chúng tôi ngay cả đối với câu hỏi thực tế của bạn. Tôi sẽ bao gồm nó một cách không chính thức.

Chúng ta hãy xem xét với trường hợp nhị thức nói chung hơn:

YBin(n,p)

Giả sử p sao cho Y gần đúng bằng một bình thường có cùng giá trị trung bình và phương sai (một số yêu cầu điển hình hơn min ( n p , n ( 1 - p ) ) không nhỏ, hoặc n p ( 1 - p ) không nhỏ).npYmin(np,n(1p))np(1p)

Sau đó sẽ xấp xỉ ~ χ 2 1 . Ở đây Y là số lần thành công.(YE(Y))2/Var(Y)χ12Y

Ta có Var ( Y ) = n p ( 1 - p ) .E(Y)=npVar(Y)=np(1p)

(Trong trường hợp thử nghiệm, được biết và p được chỉ định theo H 0. Chúng tôi không thực hiện bất kỳ ước tính nào.)npH0

Vì vậy, sẽ xấp xỉ ~ χ 2 1(Ynp)2/np(1p)χ12 .

Lưu ý rằng . Cũng lưu ý rằng 1(Ynp)2=[(nY)n(1p)]2 .1p+11p=1p(1p)

Do đó (Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Đó chỉ là thống kê chi bình phương cho trường hợp nhị thức.

Vì vậy, trong trường hợp đó, thống kê chi bình phương nên có sự phân bố bình phương của một biến ngẫu nhiên chuẩn (xấp xỉ).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.