Các tốt lành-of-fit thử nghiệm sử dụng sau đây thống kê : Trong kiểm tra, cấp giấy mà các điều kiện được đáp ứng, người ta sử dụng phân phối - để tính giá trị p đã cho là đúng, người ta sẽ quan sát giá trị đó trong một mẫu đại diện có cùng kích thước. χ2
Tuy nhiên, để thống kê tuân theo phân phối (với độ tự do), phải đúng là: cho độc lập, tiêu chuẩn bình thường ( Wikipedia ). Các điều kiện cho bài kiểm tra như sau (một lần nữa, từ Wikipedia ): χ 2 n - 1 n ∑ i = 1 ( O i - E i ) 2 Zi
- Đại diện mẫu dân số
- Cỡ mẫu lớn
- Số lượng tế bào dự kiến là đủ lớn
- Độc lập giữa mỗi loại
Từ điều kiện (1,2) rõ ràng là chúng ta thỏa mãn điều kiện suy luận từ mẫu đến dân số. (3) dường như là một giả định bắt buộc vì số lượng rời rạc , ở mẫu số, không dẫn đến phân phối gần như liên tục cho mỗi và nếu nó không đủ lớn thì có thể sửa lỗi với Yates 'hiệu chỉnh - điều này dường như xuất phát từ thực tế là một phân phối rời rạc về cơ bản là một phân phối "trôi nổi", do đó sự thay đổi cho mỗi phân phối điều chỉnh điều này.Z i 1 / 2
Sự cần thiết của (4) dường như sẽ có ích sau này, nhưng tôi không thể thấy như thế nào.
Lúc đầu, tôi nghĩ rằng là cần thiết cho thống kê để phù hợp với phân phối. Điều này dẫn tôi đến giả định nghi vấn rằng , điều đó thực sự sai. Trong thực tế, rõ ràng từ việc giảm kích thước cho hai mặt của đẳng thức từ xuống rằng điều này không thể xảy ra. Oi-Ei∼Nnn-1
Điều này đã trở nên rõ ràng, nhờ những lời giải thích của người làm trắng, rằng không cần phải bằng mỗi vì (lưu ý việc giảm số lượng các biến tóm tắt) cho các biến ngẫu nhiên bình thường tiêu chuẩn đó là chức năng độc lập.O i - E i χ20=∑n-1i=1Z2iZi
Vậy thì câu hỏi của tôi là làm thế nào để theo phân phối ? Những loại kết hợp nào của mỗi thuật ngữ dẫn đến các quy tắc chuẩn bình phương ? Điều này đòi hỏi phải sử dụng CLT, rõ ràng (và điều đó có ý nghĩa), nhưng làm thế nào? Nói cách khác , mỗi bằng (hoặc xấp xỉ bằng) là gì? χ 2 ( O i - E i ) 2