Morey et al (2015) cho rằng khoảng tin cậy là sai lệch và có nhiều sai lệch liên quan đến sự hiểu biết về chúng. Trong số những người khác, họ mô tả sai lầm chính xác như sau:
Sai lầm chính xác
Độ rộng của khoảng tin cậy biểu thị độ chính xác của kiến thức của chúng tôi về tham số. Khoảng tin cậy hẹp cho thấy kiến thức chính xác, trong khi lỗi tự tin rộng cho thấy kiến thức không chính xác.Không có mối liên hệ cần thiết giữa độ chính xác của ước tính và kích thước của khoảng tin cậy. Một cách để thấy điều này là tưởng tượng hai nhà nghiên cứu - một nhà nghiên cứu cao cấp và một nghiên cứu sinh - đang phân tích dữ liệu của người tham gia từ một thí nghiệm. Như một bài tập vì lợi ích của nghiên cứu sinh, nhà nghiên cứu cao cấp quyết định chia ngẫu nhiên những người tham gia thành hai bộ để mỗi người có thể phân tích riêng một nửa bộ dữ liệu. Trong một cuộc họp tiếp theo, hai chia sẻ với nhau Sinh viên của họ khoảng tin cậy cho giá trị trung bình. CI của nghiên cứu sinh là , và CI của nhà nghiên cứu cao cấp là .25 t 95 % 52 ± 2 95 % 53 ± 4
Nhà nghiên cứu cao cấp lưu ý rằng kết quả của họ rất nhất quán và họ có thể sử dụng giá trị trung bình có trọng số tương đương của hai ước tính điểm tương ứng của họ, , như một ước tính tổng thể về giá trị trung bình thực.
Tuy nhiên, nghiên cứu sinh cho rằng hai phương tiện của họ không nên có trọng số đồng đều: cô lưu ý rằng CI của cô rộng bằng một nửa và lập luận rằng ước tính của cô chính xác hơn và do đó nên được cân nặng hơn. Cố vấn của cô lưu ý rằng điều này không thể chính xác, bởi vì ước tính từ trọng số không đồng đều của hai phương tiện sẽ khác với ước tính từ việc phân tích bộ dữ liệu hoàn chỉnh, phải là . Sai lầm của nghiên cứu sinh là giả định rằng các TCTD trực tiếp chỉ ra độ chính xác sau dữ liệu.
Ví dụ trên dường như là sai lệch. Nếu chúng ta chia ngẫu nhiên một mẫu thành một nửa, thành hai mẫu, thì chúng ta sẽ mong đợi cả hai phương tiện mẫu và lỗi tiêu chuẩn sẽ được đóng lại. Trong trường hợp như vậy, không nên có bất kỳ sự khác biệt nào giữa việc sử dụng giá trị trung bình có trọng số (ví dụ: trọng số do lỗi nghịch đảo) và sử dụng trung bình số học đơn giản. Tuy nhiên, nếu các ước tính khác nhau và sai số ở một trong các mẫu lớn hơn đáng kể, điều này có thể gợi ý "các vấn đề" với mẫu đó.
Rõ ràng, trong ví dụ trên, kích thước mẫu là như nhau nên việc "nối lại" dữ liệu bằng cách lấy giá trị trung bình của phương tiện giống như lấy giá trị trung bình của toàn bộ mẫu. Vấn đề là toàn bộ ví dụ tuân theo logic không xác định rằng mẫu đầu tiên được chia thành các phần, sau đó được nối lại để ước tính cuối cùng.
Ví dụ có thể được đặt lại để dẫn đến kết luận ngược lại:
Nhà nghiên cứu và sinh viên quyết định chia dữ liệu của họ thành hai nửa và phân tích chúng một cách độc lập. Sau đó, họ so sánh các ước tính của họ và có vẻ như mẫu có nghĩa là họ tính toán rất khác nhau, hơn nữa sai số chuẩn của ước tính của sinh viên là lớn hơn nhiều. Học sinh sợ rằng điều này có thể gợi ý các vấn đề với độ chính xác của ước tính của mình, nhưng nhà nghiên cứu ngụ ý rằng không có mối liên hệ nào giữa các khoảng tin cậy và độ chính xác, vì vậy cả hai ước tính đều đáng tin cậy như nhau và họ có thể xuất bản bất kỳ một trong số chúng, được chọn ngẫu nhiên, như ước tính cuối cùng của họ.
Nói rõ hơn, khoảng tin cậy "chuẩn", như của Học sinh , dựa trên các lỗi
trong đó là hằng số. Trong trường hợp như vậy, chúng liên quan trực tiếp đến độ chính xác, phải không ..?
Vì vậy, câu hỏi của tôi là:
ngụy biện chính xác có thực sự là ngụy biện? Khoảng tin cậy nói gì về độ chính xác?
Morey, R., Hoekstra, R., Rouder, J., Lee, M., & Wagenmakers, E.-J. (2015). Sai lầm của việc đặt niềm tin vào khoảng tin cậy. Bản tin & Đánh giá về Tâm lý học, 1 Hàng21. https://learnbayes.org/ con / confidenceInter đạnFallacy /