Một số lựa chọn thay thế cho kiểm tra chi bình phương cho các biến phân loại có bảng lớn hơn 2 x 2 và các ô có số lượng nhỏ hơn 5, nếu tôi không muốn hợp nhất các lớp?
Một số lựa chọn thay thế cho kiểm tra chi bình phương cho các biến phân loại có bảng lớn hơn 2 x 2 và các ô có số lượng nhỏ hơn 5, nếu tôi không muốn hợp nhất các lớp?
Câu trả lời:
Có một số hiểu lầm phổ biến ở đây. Kiểm tra chi bình phương hoàn toàn tốt để sử dụng với các bảng lớn hơn . Để phân phối thực tế của thống kê kiểm tra chi bình phương để xấp xỉ phân phối chi bình phương, khuyến nghị truyền thống là tất cả các ô đều có giá trị mong đợi . Hai điều phải được lưu ý ở đây:
Không quan trọng số lượng tế bào được quan sát là gì, họ cũng có thể là mà không có vấn đề gì, chỉ có vấn đề về số lượng dự kiến .
Quy tắc truyền thống này hiện được biết là quá bảo thủ. Có thể ổn khi có số ô có số lượng dự kiến miễn là không có số lượng dự kiến là . Xem:
Nếu số lượng dự kiến của bạn không phù hợp với tiêu chí chính xác hơn này, có một số tùy chọn thay thế có sẵn:
Đặt cược tốt nhất của bạn có lẽ là mô phỏng phân phối lấy mẫu của thống kê kiểm tra hoặc sử dụng thử nghiệm hoán vị. Trong R, ví dụ, bạn có thể chỉ cần đặt chisq.test(..., simulate.p.value=TRUE)
. Phần mềm khác cũng nên làm điều này có thể.
Bạn có thể sử dụng một bài kiểm tra thay thế, chẳng hạn như bài kiểm tra chính xác của Fisher. Mặc dù thử nghiệm chính xác của Fisher thường được khuyến nghị trong tình huống này, điều đáng chú ý là nó đưa ra các giả định khác nhau và có thể không phù hợp. Cụ thể, thử nghiệm chính xác của Fisher giả định số lượng hàng và cột được đặt trước và chỉ có sự sắp xếp của các tổ hợp cột x có thể thay đổi (xem: Với sức mạnh của máy tính ngày nay, có bao giờ có lý do để thực hiện kiểm tra chi bình phương không thay vì kiểm tra chính xác của Fisher? ). Nếu bạn không thoải mái với giả định này, mô phỏng chi bình phương sẽ là một lựa chọn tốt hơn.