Bối cảnh: Tôi đang thuyết trình cho các đồng nghiệp đang làm bài kiểm tra giả thuyết và hiểu hầu hết mọi thứ đều ổn nhưng có một khía cạnh là tôi tự trói mình trong những nút thắt cố gắng hiểu cũng như giải thích nó cho người khác.
Đây là những gì tôi nghĩ rằng tôi biết (xin vui lòng sửa nếu sai!)
- Thống kê sẽ là bình thường nếu phương sai được biết đến, hãy tuân theo phân phối nếu phương sai không xác định
- CLT (Định lý giới hạn trung tâm): Phân phối mẫu của giá trị trung bình mẫu xấp xỉ bình thường đối với đủ lớn (có thể là , có thể lên tới đối với các phân phối sai lệch cao)30 300
- Phân phối có thể được coi là Bình thường cho mức độ tự do> 30
Bạn sử dụng -test nếu:
- Dân số bình thường và phương sai đã biết (đối với mọi cỡ mẫu)
- Dân số bình thường, phương sai không xác định và (do CLT)
- phân dân số, ,n q > 10
Bạn sử dụng test nếu:
- Dân số bình thường, phương sai không xác định và
- Không có kiến thức về dân số hoặc phương sai và , nhưng dữ liệu mẫu có vẻ bình thường / vượt qua các bài kiểm tra, v.v. vì vậy dân số có thể được giả định là bình thường
Vì vậy, tôi còn lại với:
- Đối với các mẫu và (?), Không có kiến thức về dân số và phương sai được biết / chưa biết.< ≈ 300
Vì vậy, câu hỏi của tôi là:
Ở cỡ mẫu nào bạn có thể giả định (trong đó không có kiến thức về phân bố dân số hoặc phương sai) rằng phân phối mẫu của giá trị trung bình là bình thường (nghĩa là CLT đã khởi động) khi phân phối mẫu có vẻ không bình thường? Tôi biết rằng một số bản phân phối cần , nhưng một số tài nguyên dường như nói sử dụng -test bất cứ khi nào ...z n > 30
Đối với các trường hợp tôi không chắc chắn, tôi cho rằng tôi xem xét dữ liệu cho tính quy tắc. Bây giờ, nếu dữ liệu mẫu trông có vẻ bình thường, tôi có sử dụng -test (vì giả sử dân số bình thường và vì ) không?n > 30
Điều gì về nơi dữ liệu mẫu cho các trường hợp tôi không chắc chắn về việc trông không bình thường? Có bất kỳ trường hợp nào bạn vẫn sử dụng -test hoặc -test hoặc bạn luôn tìm cách biến đổi / sử dụng các xét nghiệm không tham số? Tôi biết rằng, do CLT, tại một số giá trị của , phân phối lấy mẫu của giá trị trung bình sẽ gần đúng với bình thường nhưng dữ liệu mẫu sẽ không cho tôi biết giá trị của là gì; dữ liệu mẫu có thể không bình thường trong khi giá trị trung bình của mẫu theo mức bình thường / . Có trường hợp nào bạn chuyển đổi / sử dụng thử nghiệm không tham số trong khi thực tế phân phối lấy mẫu của giá trị trung bình là bình thường / nhưng bạn không thể biết? z n n t t