Dư lượng của Pearson


16

Câu hỏi của người mới bắt đầu về phần còn lại của Pearson trong bối cảnh của bài kiểm tra chi bình phương về mức độ phù hợp:

Cũng như thống kê kiểm tra, chisq.testchức năng của R báo cáo số dư của Pearson:

(obs - exp) / sqrt(exp)

Tôi hiểu tại sao nhìn vào sự khác biệt thô giữa các giá trị được quan sát và dự kiến ​​không phải là thông tin, vì một mẫu nhỏ hơn sẽ dẫn đến sự khác biệt nhỏ hơn. Tuy nhiên, tôi muốn biết thêm về tác dụng của mẫu số: tại sao chia cho gốc của giá trị mong đợi? Đây có phải là phần dư 'chuẩn hóa' không?


6
Mẫu số được sử dụng để tính toán phương sai của phần dư thô, sau đó làm cho phần dư của Pearson xấp xỉ phương sai đơn vị (có các phương pháp khác để đạt được điều này). Xin lưu ý rằng có một thành phần stdrescho phần dư được tiêu chuẩn hóa.
chl

@chl Cảm ơn bạn đã phản hồi nhanh chóng. Tuy nhiên, tôi không hiểu khái niệm phương sai trong bối cảnh này. Bạn có biết bất kỳ tài nguyên nào mà tôi có thể tìm hiểu thêm không? Sau đó, tôi giả sử rằng phần dư của Pearson không được 'chuẩn hóa', do đó chisq.testcũng tính toán stdresthành phần?
Iain Dillingham

3
Tài liệu tham khảo chính xác cho việc phân tích dữ liệu phân loại có lẽ là Phân tích dữ liệu phân loại , bởi Alan Agresti. Nếu không ai cung cấp câu trả lời chi tiết hơn, tôi sẽ cố gắng chuyển đổi nhận xét của mình thành câu trả lời thích hợp.
chl

Cảm ơn đã liên kết, @chl. Tôi đã truy cập vào cuốn sách, vì vậy tôi sẽ cố gắng tự mình tìm ra cuốn sách này.
Iain Dillingham

Câu trả lời:


10

Mô hình thống kê tiêu chuẩn phân tích cơ bản các bảng dự phòng là giả định rằng (vô điều kiện trên tổng số) số lượng tế bào là các biến ngẫu nhiên Poisson độc lập. Vì vậy, nếu bạn có bảng dự phòng n×m , mô hình thống kê được sử dụng làm cơ sở để phân tích sẽ lấy mỗi số lượng tế bào để có phân phối vô điều kiện:

XTôi,j ~ Pois(μTôi,j)

Khi bạn áp đặt tổng số ô cho bảng dự phòng, hoặc số hàng hoặc số cột, kết quả phân phối có điều kiện của số lượng ô sẽ trở thành đa thức. Trong mọi trường hợp, đối với phân phối Poisson, chúng ta có E(XTôi,j)= =V(XTôi,j)= =μTôi,j , vì vậy số lượng tế bào được tiêu chuẩn hóa là:

STD(XTôi,j)XTôi,j-E(XTôi,j)V(XTôi,j)= =XTôi,j-μTôi,jμTôi,j

Vì vậy, những gì bạn đang thấy trong công thức bạn đang tìm hiểu, là số lượng tế bào được tiêu chuẩn hóa, theo giả định rằng số lượng tế bào có phân phối Poisson (vô điều kiện).

Từ đây, người ta thường kiểm tra tính độc lập của biến hàng và cột trong dữ liệu và trong trường hợp này, bạn có thể sử dụng thống kê kiểm tra xem tổng bình phương của các giá trị trên (tương đương với chỉ tiêu bình phương của vectơ của các giá trị tiêu chuẩn). Thử nghiệm chi bình phương cung cấp giá trị p cho loại thử nghiệm này dựa trên xấp xỉ mẫu lớn với phân phối null của thống kê kiểm tra. Nó thường được áp dụng trong trường hợp không có số lượng bán quá nhỏ.


0

Trong bối cảnh mức độ phù hợp, bạn có thể tham khảo http://www.stat.yale.edu/Cifts/1997-98/101/chigf.htm này .

Nếu bạn muốn biết làm thế nào mẫu số đạt được ở đó, bạn sẽ phải xem chi bình phương ở đây như một xấp xỉ bình thường đối với nhị thức, đối với người mới bắt đầu, sau đó có thể được mở rộng thành đa thức.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.