Sau một cuộc bỏ phiếu gần đây, tôi đã cố gắng kiểm tra sự hiểu biết của mình về bài kiểm tra Pearson Chi Squared. Tôi thường sử dụng thống kê chi bình phương (hoặc giảm thống kê chi bình phương) để phù hợp hoặc kiểm tra kết quả phù hợp. Trong trường hợp này, phương sai thường không phải là số lượng đếm dự kiến trong một bảng hoặc biểu đồ mà là một số phương sai được xác định bằng thực nghiệm. Dù bằng cách nào, tôi luôn có ấn tượng rằng thử nghiệm vẫn sử dụng tính quy phạm tiệm cận của PDF đa phương (tức là thống kê thử nghiệm của tôi là
và là bất thường đa thức trong đó là ma trận hiệp phương sai). Do đó, có phân phối chi bình phương cho lớn, do đó, sử dụng số lượng đếm dự kiến làm mẫu số trong thống kê sẽ trở thành hợp lệ cho lớn . Có thể điều này chỉ đúng với biểu đồ, tôi đã không phân tích một bảng dữ liệu nhỏ trong nhiều năm.
Có một lập luận tinh tế hơn mà tôi đang thiếu? Tôi sẽ quan tâm đến một tài liệu tham khảo, hoặc thậm chí tốt hơn một lời giải thích ngắn. (Mặc dù có thể tôi vừa bỏ phiếu vì đã bỏ qua từ không có triệu chứng, mà tôi thừa nhận là khá quan trọng.)