Bạn đã đúng khi nói rằng khoảng tin cậy 95% là những kết quả của việc sử dụng phương pháp hoạt động trong 95% trường hợp, thay vì bất kỳ khoảng riêng lẻ nào có khả năng chứa 95% giá trị mong đợi.
"Cơ sở logic và giải thích các giới hạn niềm tin, ngay cả bây giờ, là một vấn đề gây tranh cãi." {David Colquhoun, 1971, Các bài giảng về Thống kê sinh học}
Câu trích dẫn đó được lấy từ một cuốn sách giáo khoa thống kê được xuất bản năm 1971, nhưng tôi cho rằng nó vẫn đúng trong năm 2010. Cuộc tranh cãi có lẽ là cực đoan nhất trong trường hợp khoảng tin cậy đối với tỷ lệ nhị thức. Có nhiều phương pháp cạnh tranh để tính các khoảng tin cậy đó, nhưng chúng đều không chính xác theo một hoặc nhiều giác quan và ngay cả phương pháp thực hiện tồi tệ nhất cũng có sự đề xuất giữa các tác giả sách giáo khoa. Ngay cả những khoảng thời gian được gọi là "chính xác" cũng không mang lại các đặc tính mong đợi của khoảng tin cậy.
Trong một bài báo viết cho các bác sĩ phẫu thuật (được biết đến rộng rãi vì họ quan tâm đến thống kê!), John Ludbrook và tôi đã lập luận về việc sử dụng các khoảng tin cậy thường xuyên được tính bằng cách sử dụng một thống nhất Bayes trước vì các khoảng đó có tính chất thường xuyên tốt như bất kỳ phương pháp nào khác (trung bình độ che phủ chính xác 95% so với tất cả các tỷ lệ thực), nhưng quan trọng là độ che phủ tốt hơn nhiều so với tất cả các tỷ lệ quan sát được (độ che phủ chính xác 95%). Bài báo, vì đối tượng mục tiêu của nó, không chi tiết khủng khiếp và vì vậy nó có thể không thuyết phục được tất cả các nhà thống kê, nhưng tôi đang làm việc trên một bài báo tiếp theo với đầy đủ các kết quả và biện minh.
Đây là một trường hợp trong đó phương pháp Bayes có các thuộc tính thường xuyên tốt như cách tiếp cận thường xuyên, một điều xảy ra khá thường xuyên. Giả định về đồng phục trước không có vấn đề gì vì sự phân bố đồng đều về tỷ lệ dân số được xây dựng trong mọi tính toán của phạm vi bảo hiểm thường xuyên mà tôi gặp phải.
Bạn hỏi: "Có cách nào để xem xét khoảng tin cậy, ít nhất là trong một số trường hợp, điều này sẽ có ý nghĩa đối với người dùng thống kê không?" Sau đó, câu trả lời của tôi là trong các khoảng tin cậy nhị thức, người ta có thể nhận được các khoảng có chứa tỷ lệ dân số chính xác 95% thời gian cho tất cả các tỷ lệ quan sát được. Đó là một có. Tuy nhiên, việc sử dụng thông thường các khoảng tin cậy sẽ bảo hiểm cho tất cả các tỷ lệ dân số và cho câu trả lời là "Không!"
Độ dài của các câu trả lời cho câu hỏi của bạn và các câu trả lời khác nhau cho thấy khoảng tin cậy bị hiểu sai rộng rãi. Nếu chúng tôi thay đổi mục tiêu của chúng tôi từ phạm vi bảo hiểm cho tất cả các giá trị tham số thực sang phạm vi bảo hiểm của giá trị tham số thực cho tất cả các giá trị mẫu, điều đó có thể trở nên dễ dàng hơn vì các khoảng thời gian sau đó sẽ được định hình có liên quan trực tiếp đến các giá trị được quan sát thay vì hiệu suất của phương pháp mỗi se.