Ban đầu tôi đã đăng câu dưới đây như một câu trả lời một phần cho câu hỏi hỏi tại sao khoảng tin cậy 95% không ngụ ý rằng có 95% khả năng khoảng đó chứa giá trị trung bình thực (xem: Tại sao Khoảng tin cậy (CI) 95% không ngụ ý 95% cơ hội chứa giá trị trung bình? ). Một người bình luận (cảm ơn John) sau đó đã yêu cầu tôi đăng bình luận dưới dạng một câu hỏi riêng biệt, vì vậy hãy đến đây.
Đầu tiên, tôi sẽ giả định rằng nếu tôi chọn một thẻ chơi ngẫu nhiên từ một cỗ bài tiêu chuẩn, xác suất tôi đã chọn một câu lạc bộ (mà không cần nhìn vào nó) là 13/52 = 25%.
Và thứ hai, đã được tuyên bố nhiều lần rằng khoảng tin cậy 95% nên được giải thích theo cách lặp lại một thử nghiệm nhiều lần và khoảng thời gian được tính toán sẽ chứa ý nghĩa thực sự 95% của thời gian - Tôi nghĩ rằng điều này được James Waters chứng minh một cách hợp lý mô phỏng trong câu hỏi liên kết ở trên. Hầu hết mọi người dường như chấp nhận cách giải thích này của CI 95%.
Bây giờ, cho các thí nghiệm suy nghĩ. Giả sử rằng chúng ta có một biến phân phối bình thường trong một dân số lớn - có thể là chiều cao của nam hoặc nữ trưởng thành. Tôi có một trợ lý sẵn sàng và không mệt mỏi mà tôi giao nhiệm vụ thực hiện nhiều quy trình lấy mẫu với cỡ mẫu nhất định từ dân số và tính trung bình mẫu và khoảng tin cậy 95% cho mỗi mẫu. Trợ lý của tôi rất quan tâm và quản lý để đo lường tất cả các mẫu có thể từ dân số. Sau đó, đối với mỗi mẫu, trợ lý của tôi ghi lại khoảng tin cậy kết quả là màu xanh lá cây (nếu CI chứa giá trị trung bình thực) hoặc màu đỏ (nếu CI không chứa giá trị trung bình thực). Thật không may, trợ lý của tôi sẽ không cho tôi thấy kết quả thí nghiệm của anh ấy. Tôi cần có được một số thông tin về chiều cao của người lớn trong dân chúng nhưng tôi chỉ có thời gian, tài nguyên và sự kiên nhẫn để làm thí nghiệm một lần. Tôi tạo một mẫu ngẫu nhiên duy nhất (có cùng cỡ mẫu được sử dụng bởi trợ lý của tôi) và tính khoảng tin cậy (sử dụng cùng một phương trình).
Tôi không có cách nào để xem kết quả của trợ lý của tôi. Vì vậy, xác suất mà mẫu ngẫu nhiên tôi đã chọn sẽ mang lại một CI màu xanh lá cây (tức là khoảng chứa giá trị trung bình thực) là bao nhiêu?
Trong suy nghĩ của tôi, điều này giống như tình huống thẻ được nêu ra trước đây và có thể được hiểu rằng có xác suất 95% rằng khoảng thời gian được tính bằng mẫu của tôi là màu xanh lá cây (nghĩa là có nghĩa là đúng). Tuy nhiên, sự đồng thuận dường như là khoảng tin cậy 95% KHÔNG thể được hiểu vì có xác suất 95% rằng khoảng đó chứa giá trị trung bình thực. Tại sao (và ở đâu) lý luận của tôi trong thí nghiệm suy nghĩ ở trên sụp đổ?