Đây là điều có thể khó hiểu:
- nếu trung bình 95% của tất cả các khoảng tin cậy sẽ chứa tham số
- và tôi có một khoảng tin cậy cụ thể
- Tại sao xác suất khoảng thời gian này chứa tham số cũng là 95%?
Khoảng tin cậy liên quan đến quy trình lấy mẫu. Nếu bạn lấy nhiều mẫu và tính khoảng tin cậy 95% cho mỗi mẫu, bạn sẽ thấy rằng 95% trong số các khoảng đó có nghĩa là dân số.
Điều này rất hữu ích cho các phòng ban chất lượng công nghiệp. Những kẻ đó lấy nhiều mẫu, và bây giờ họ có niềm tin rằng hầu hết các ước tính của họ sẽ khá gần với thực tế. Họ biết rằng 95% ước tính của họ là khá tốt, nhưng họ không thể nói điều đó về từng ước tính cụ thể.
So sánh điều này với xúc xắc lăn: nếu bạn sẽ tung xúc xắc 600 (công bằng), bạn sẽ ném bao nhiêu 6? Dự đoán tốt nhất của bạn là * 600 = 100.16
Tuy nhiên, nếu bạn đã ném MỘT người chết, thật vô ích khi nói: "Có xác suất 1/6 hoặc 16,6% mà bây giờ tôi đã ném 6". Tại sao? Bởi vì cái chết cho thấy một số 6, hoặc một số hình khác. Bạn đã ném 6, hoặc không. Vậy xác suất là 1 hoặc 0. Xác suất không thể là .16
Khi được hỏi trước khi ném, xác suất ném 6 người với MỘT người chết là bao nhiêu, một người Bayes sẽ trả lời " " (dựa trên thông tin trước: mọi người đều biết rằng một người chết có 6 mặt và cơ hội như nhau rơi vào một trong hai), nhưng một Người thường xuyên sẽ nói "Không có ý tưởng" bởi vì chủ nghĩa thường xuyên chỉ dựa trên dữ liệu, không dựa trên các linh mục hoặc bất kỳ thông tin bên ngoài nào.16
Tương tự như vậy, nếu bạn chỉ có 1 mẫu (như vậy là 1 khoảng tin cậy), bạn không có cách nào để nói khả năng của dân số trong khoảng đó là bao nhiêu. Giá trị trung bình (hoặc bất kỳ tham số nào) có trong đó hoặc không. Xác suất là 1 hoặc 0.
Ngoài ra, không đúng khi các giá trị trong Khoảng tin cậy có nhiều khả năng hơn các giá trị bên ngoài đó. Tôi đã làm một minh họa nhỏ; mọi thứ được đo bằng ° C. Hãy nhớ rằng, nước đóng băng ở 0 ° C và sôi ở 100 ° C.
Trường hợp: trong một hồ nước lạnh, chúng tôi muốn ước tính nhiệt độ của nước chảy bên dưới lớp băng. Chúng tôi đo nhiệt độ ở 100 địa điểm. Đây là dữ liệu của tôi:
- 0,1 ° C (đo ở 49 địa điểm);
- 0,2 ° C (cũng ở 49 địa điểm);
- 0 ° C (. Trong 1 vị trí này là nước chỉ sắp đóng băng);
- 95 ° C (tại một địa điểm, có một nhà máy đổ nước rất nóng vào hồ).
- Nhiệt độ trung bình: 1,1 ° C;
- Độ lệch chuẩn: 1,5 ° C;
- 95% -CI: (-0,8 ° C ...... + 3.0 ° C).
Nhiệt độ trong khoảng tin cậy này chắc chắn KHÔNG nhiều khả năng hơn nhiệt độ bên ngoài nó. Nhiệt độ trung bình của nước chảy trong hồ này KHÔNG THỂ lạnh hơn 0 ° C, nếu không đó sẽ không phải là nước mà là nước đá. Một phần của khoảng tin cậy này (cụ thể là phần từ -0,8 đến 0) thực sự có xác suất 0% chứa tham số thực.
Tóm lại: khoảng tin cậy là một khái niệm thường xuyên, và do đó dựa trên ý tưởng về các mẫu lặp lại. Nếu nhiều nhà nghiên cứu sẽ lấy mẫu từ hồ này và nếu tất cả các nhà nghiên cứu đó tính toán khoảng tin cậy, thì 95% trong số các khoảng đó sẽ chứa tham số thực. Nhưng đối với một khoảng tin cậy duy nhất, không thể nói khả năng của nó chứa tham số thực như thế nào.