Mối quan hệ giữa một bài kiểm tra bình phương chi và kiểm tra tỷ lệ bằng nhau là gì?


52

Giả sử rằng tôi có ba quần thể với bốn đặc điểm loại trừ lẫn nhau. Tôi lấy các mẫu ngẫu nhiên từ mỗi quần thể và xây dựng bảng chéo hoặc bảng tần số cho các đặc điểm mà tôi đang đo. Tôi có đúng không khi nói rằng:

  1. Nếu tôi muốn kiểm tra xem liệu có bất kỳ mối quan hệ nào giữa các quần thể và các đặc điểm hay không (ví dụ: liệu một quần thể có tần số cao hơn một trong các đặc điểm hay không), tôi nên chạy thử nghiệm bình phương và xem kết quả có đáng kể hay không.

  2. Nếu kiểm tra chi bình phương có ý nghĩa, nó chỉ cho tôi thấy rằng có một số mối quan hệ giữa các quần thể và đặc điểm, chứ không phải chúng có liên quan như thế nào.

  3. Hơn nữa, không phải tất cả các đặc điểm cần phải liên quan đến dân số. Ví dụ, nếu các quần thể khác nhau có sự phân bố khác nhau đáng kể về các đặc điểm A và B, nhưng không phải của C và D, thì phép thử chi bình phương vẫn có thể trở lại đáng kể.

  4. Nếu tôi muốn đo xem một đặc tính cụ thể có bị ảnh hưởng bởi dân số hay không, thì tôi có thể chạy thử nghiệm cho các tỷ lệ bằng nhau (tôi đã thấy điều này được gọi là kiểm tra z, hoặc như prop.test()trong R) về đặc điểm đó.

Nói cách khác, có phù hợp để sử dụng prop.test()để xác định chính xác hơn bản chất của mối quan hệ giữa hai bộ danh mục khi kiểm tra chi bình phương nói rằng có một mối quan hệ đáng kể?


Câu trả lời:


23

Câu trả lời rất ngắn:

Phép thử chi bình phương (tính chisq.test()bằng R) so sánh các tần số quan sát được trong mỗi loại của bảng dự phòng với tần số dự kiến ​​(được tính là sản phẩm của tần số biên). Nó được sử dụng để xác định xem độ lệch giữa số lượng quan sát được và số lượng dự kiến ​​có quá lớn để quy cho sự tình cờ hay không. Khởi hành từ sự độc lập có thể dễ dàng kiểm tra bằng cách kiểm tra các phần dư (thử ?mosaicplothoặc ?assocplot, nhưng cũng nhìn vào vcdgói hàng). Sử dụng fisher.test()cho một thử nghiệm chính xác (dựa vào phân phối siêu bội).

Các prop.test()chức năng trong R cho phép để kiểm tra xem tỷ lệ có thể so sánh giữa các nhóm hoặc không khác với xác suất lý thuyết. Nó được gọi là -test vì thống kê kiểm tra trông như thế này:z

z=(f1f2)p^(1p^)(1n1+1n2)

trong đó và các chỉ số đề cập đến dòng đầu tiên và thứ hai trong bảng của bạn. Trong bảng dự phòng hai chiều trong đó , điều này sẽ mang lại kết quả tương đương với thử nghiệm thông thường :(1,2)H0:p^=(p1+p2)/(n1+n2)(1,2)χ 2H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Để phân tích dữ liệu rời rạc với R, tôi rất khuyến nghị Hướng dẫn sử dụng R (và S-PLUS) để phân tích dữ liệu phân loại của Agresti (2002) , từ Laura Thompson.


2
Có một tên chung cho thử nghiệm mà prop.test () thực hiện không?
Atticus29

2
"Nó được gọi là một thử nghiệm z".
russellpierce

@chl Tôi hơi bối rối - Tôi nghĩ prop.testchisq.testcả hai đều sử dụng bình phương chi, nó sẽ giải thích các giá trị p giống hệt nhau, cũng như tại sao trong bài đăng này trên R-Bloggers họ có chức năng ad hoc riêng.
Antoni Parellada

@Antoni Vâng, đây là những gì Keith giải thích trong bài trả lời của mình.
chl

3
whats và , , , , ? n 2 f 1 f 2 p 1 p 2n1n2f1f2p1p2
tomka

23

Một phép thử chi bình phương cho sự bằng nhau của hai tỷ lệ hoàn toàn giống với phép thử -test. Phân phối chi bình phương với một bậc tự do chỉ là một độ lệch bình thường, bình phương. Về cơ bản, bạn chỉ cần lặp lại bài kiểm tra chi bình phương trên một tập hợp con của bảng dự phòng. (Đây là lý do tại sao @chl có cùng giá trị với cả hai bài kiểm tra.)pzp

Vấn đề của việc thực hiện kiểm tra chi bình phương trên toàn cầu trước tiên và sau đó lặn xuống để thực hiện thêm các thử nghiệm trên các tập hợp con là bạn không nhất thiết phải bảo toàn alpha của mình - nghĩa là, bạn sẽ không kiểm soát dương tính giả dưới 5% (hoặc bất cứ điều gì ) trên toàn bộ thí nghiệm.α

Tôi nghĩ rằng nếu bạn muốn làm điều này đúng trong mô hình cổ điển, bạn cần xác định các giả thuyết của mình ngay từ đầu (tỷ lệ để so sánh), thu thập dữ liệu và sau đó kiểm tra các giả thuyết sao cho tổng ngưỡng cho mỗi tổng kiểm tra đến . Trừ khi bạn có thể chứng minh một tiên nghiệm rằng có một số mối tương quan.α

Bài kiểm tra mạnh mẽ nhất về sự bình đẳng về tỷ lệ được gọi là bài kiểm tra về sự vượt trội của Barnard .


@gung Tôi hơi bối rối - Tôi nghĩ prop.testchisq.testcả hai đều sử dụng bình phương chi, nó sẽ giải thích các giá trị p giống hệt nhau, cũng như tại sao trong bài đăng này trên R-Bloggers họ có chức năng ad hoc riêng.
Antoni Parellada

Tôi không hiểu điều gì làm bạn bối rối, @AntoniParellada. Câu trả lời này nói rằng chúng "hoàn toàn giống nhau", điều này có ý nghĩa nếu "cả hai sử dụng bình phương".
gung - Phục hồi Monica

@gung trong câu trả lời ban đầu chl nói rằng prop.test()... được gọi là phép thử z trái ngược với chisq.test(). Sau đó Keith nói, "Một phép thử chi bình phương cho hai đẳng thức hoàn toàn giống với phép thử z (Đây là lý do tại sao @chl có cùng giá trị p với cả hai phép thử.)
Antoni Parellada

1
Đó dường như chỉ là một cụm từ không thường xuyên, @AntoniParellada. Về mặt khái niệm, 2 bài kiểm tra rất khác biệt, đó là những gì tôi đã thảo luận trong câu trả lời khác mà bạn đã thấy. Nhưng về mặt toán học, chúng là tương đương. Trên thực tế, tôi tin rằng hàm R prop.test()thực sự chỉ gọi chisq.test()và in đầu ra khác nhau.
gung - Phục hồi Monica

@gung Tôi đã làm việc với một chức năng tương tự R-Bloggers và tôi sẽ tạo một bài đăng cho những người ở cấp độ mới bắt đầu của tôi, trích dẫn bạn trong thực tế về một số khái niệm chính mà bạn đã viết, chạy qua toán học cho cả chi kiểm tra vuông và z, và sau đó đưa ra mã R.
Antoni Parellada
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.