Giả sử rằng tôi có ba quần thể với bốn đặc điểm loại trừ lẫn nhau. Tôi lấy các mẫu ngẫu nhiên từ mỗi quần thể và xây dựng bảng chéo hoặc bảng tần số cho các đặc điểm mà tôi đang đo. Tôi có đúng không khi nói rằng:
Nếu tôi muốn kiểm tra xem liệu có bất kỳ mối quan hệ nào giữa các quần thể và các đặc điểm hay không (ví dụ: liệu một quần thể có tần số cao hơn một trong các đặc điểm hay không), tôi nên chạy thử nghiệm bình phương và xem kết quả có đáng kể hay không.
Nếu kiểm tra chi bình phương có ý nghĩa, nó chỉ cho tôi thấy rằng có một số mối quan hệ giữa các quần thể và đặc điểm, chứ không phải chúng có liên quan như thế nào.
Hơn nữa, không phải tất cả các đặc điểm cần phải liên quan đến dân số. Ví dụ, nếu các quần thể khác nhau có sự phân bố khác nhau đáng kể về các đặc điểm A và B, nhưng không phải của C và D, thì phép thử chi bình phương vẫn có thể trở lại đáng kể.
Nếu tôi muốn đo xem một đặc tính cụ thể có bị ảnh hưởng bởi dân số hay không, thì tôi có thể chạy thử nghiệm cho các tỷ lệ bằng nhau (tôi đã thấy điều này được gọi là kiểm tra z, hoặc như
prop.test()
trongR
) về đặc điểm đó.
Nói cách khác, có phù hợp để sử dụng prop.test()
để xác định chính xác hơn bản chất của mối quan hệ giữa hai bộ danh mục khi kiểm tra chi bình phương nói rằng có một mối quan hệ đáng kể?