Giải thích khoảng tin cậy 95%


10

Ban đầu tôi đã đăng câu dưới đây như một câu trả lời một phần cho câu hỏi hỏi tại sao khoảng tin cậy 95% không ngụ ý rằng có 95% khả năng khoảng đó chứa giá trị trung bình thực (xem: Tại sao Khoảng tin cậy (CI) 95% không ngụ ý 95% cơ hội chứa giá trị trung bình? ). Một người bình luận (cảm ơn John) sau đó đã yêu cầu tôi đăng bình luận dưới dạng một câu hỏi riêng biệt, vì vậy hãy đến đây.

Đầu tiên, tôi sẽ giả định rằng nếu tôi chọn một thẻ chơi ngẫu nhiên từ một cỗ bài tiêu chuẩn, xác suất tôi đã chọn một câu lạc bộ (mà không cần nhìn vào nó) là 13/52 = 25%.

Và thứ hai, đã được tuyên bố nhiều lần rằng khoảng tin cậy 95% nên được giải thích theo cách lặp lại một thử nghiệm nhiều lần và khoảng thời gian được tính toán sẽ chứa ý nghĩa thực sự 95% của thời gian - Tôi nghĩ rằng điều này được James Waters chứng minh một cách hợp lý mô phỏng trong câu hỏi liên kết ở trên. Hầu hết mọi người dường như chấp nhận cách giải thích này của CI 95%.

Bây giờ, cho các thí nghiệm suy nghĩ. Giả sử rằng chúng ta có một biến phân phối bình thường trong một dân số lớn - có thể là chiều cao của nam hoặc nữ trưởng thành. Tôi có một trợ lý sẵn sàng và không mệt mỏi mà tôi giao nhiệm vụ thực hiện nhiều quy trình lấy mẫu với cỡ mẫu nhất định từ dân số và tính trung bình mẫu và khoảng tin cậy 95% cho mỗi mẫu. Trợ lý của tôi rất quan tâm và quản lý để đo lường tất cả các mẫu có thể từ dân số. Sau đó, đối với mỗi mẫu, trợ lý của tôi ghi lại khoảng tin cậy kết quả là màu xanh lá cây (nếu CI chứa giá trị trung bình thực) hoặc màu đỏ (nếu CI không chứa giá trị trung bình thực). Thật không may, trợ lý của tôi sẽ không cho tôi thấy kết quả thí nghiệm của anh ấy. Tôi cần có được một số thông tin về chiều cao của người lớn trong dân chúng nhưng tôi chỉ có thời gian, tài nguyên và sự kiên nhẫn để làm thí nghiệm một lần. Tôi tạo một mẫu ngẫu nhiên duy nhất (có cùng cỡ mẫu được sử dụng bởi trợ lý của tôi) và tính khoảng tin cậy (sử dụng cùng một phương trình).

Tôi không có cách nào để xem kết quả của trợ lý của tôi. Vì vậy, xác suất mà mẫu ngẫu nhiên tôi đã chọn sẽ mang lại một CI màu xanh lá cây (tức là khoảng chứa giá trị trung bình thực) là bao nhiêu?

Trong suy nghĩ của tôi, điều này giống như tình huống thẻ được nêu ra trước đây và có thể được hiểu rằng có xác suất 95% rằng khoảng thời gian được tính bằng mẫu của tôi là màu xanh lá cây (nghĩa là có nghĩa là đúng). Tuy nhiên, sự đồng thuận dường như là khoảng tin cậy 95% KHÔNG thể được hiểu vì có xác suất 95% rằng khoảng đó chứa giá trị trung bình thực. Tại sao (và ở đâu) lý luận của tôi trong thí nghiệm suy nghĩ ở trên sụp đổ?


Sự khác biệt sẽ là trong ví dụ của bạn, bạn thực sự biết dân số có nghĩa là gì. Do đó, trong số một trăm khoảng tin cậy, bạn có thể ước tính 95 trong số chúng sẽ có màu xanh và 5 sẽ có màu đỏ. Nói giá trị trung bình có xác suất 95% trong CI làm cho âm thanh (với tôi) như thể giá trị trung bình được xác định bởi CI, trong khi thực tế, giá trị trung bình được đưa ra (mặc dù chúng ta không biết nó là gì) và CI được ước tính. Vấn đề là với việc sử dụng thuật ngữ "xác suất" trên một cái gì đó mang tính quyết định, nhưng không quan sát được, trái ngược với thực sự ngẫu nhiên.
Marie.

@ Marie.P. Cám ơn bạn đã góp ý. Nó giúp làm mờ sương một chút. Tuy nhiên, để tiếp tục với ví dụ có phần khó hiểu, trợ lý của tôi có thể tính toán dân số nhưng tôi không có quyền truy cập vào thông tin đó; Tôi chỉ có thông tin được thu thập từ một mẫu duy nhất. Tôi đã cố gắng đảm bảo rằng tôi đã xem xét xác suất mà CI (được tính bằng cách sử dụng dữ liệu mẫu của tôi) có chứa giá trị trung bình thay vì xác suất của giá trị trung bình trong một CI nhất định (như bạn đã nêu), mà tôi nghĩ là các xác nhận hơi khác nhau. Nhưng câu cuối cùng trong bình luận của bạn không giúp được gì.
dùng1718097

Câu trả lời:


2

Sự nhầm lẫn xuất phát từ câu này:

Tuy nhiên, sự đồng thuận dường như là khoảng tin cậy 95% KHÔNG thể được hiểu vì có xác suất 95% rằng khoảng đó chứa giá trị trung bình thực.

Đó là một sự hiểu lầm một phần của sự đồng thuận thực sự. Sự rắc rối xuất phát từ việc không cụ thể về những gì khả năng chúng ta nói về. Không phải là một câu hỏi triết học mà là "xác suất chính xác mà chúng ta đang nói đến trong bối cảnh". Như @ratsalad nói rằng đó là tất cả về điều hòa.

Gọi tham số của bạn, dữ liệu của bạn, một khoảng là hàm của :θXIX

  • I là khoảng tin cậy có nghĩa là cho tất cả các có thể bao gồm cả giá trị thực. Xác suất trung bình trên tất cả các có thể tại cố định . Đây là những gì bạn giải thích trong giải thích của bạn.P(θIθ)>0.95θXθ
  • I là một khoảng tin cậy (Bayes) cho biết . Xác suất trung bình trên tất cả các khả năng tại cố định .P(θIX)>0.95θX

Cả hai đều có xác suất của cùng một sự kiện nhưng điều kiện khác nhau.

Lý do tại sao người ta không khuyến khích nói "xác suất mà ở trong là 0,95" cho các khoảng tin cậy là bởi vì câu này có nghĩa là điểm thứ hai: khi chúng ta nói "xác suất mà ..." điều kiện được ngầm hiểu với những gì đã xảy ra đã quan sát trước đây : "Tôi đã thấy một số , bây giờ xác suất mà là ..." chính thức là " " là gì.θIXθP(θ...X)

Ngụ ý này được củng cố bởi gợi ý (một lần nữa ngầm) mà bạn gặp phải khi đọc "xác suất ở trong " rằng là biến và là đối tượng cố định, trong khi trong phân tích thường xuyên thì ngược lại.θIθI

Cuối cùng, điều này còn tệ hơn khi bạn thay thế bằng khoảng thời gian tính toán của bạn. Nếu bạn viết: "Xác suất nằm trong là 0,95" thì điều này chỉ đơn giản là sai. Trong phân tích thường xuyên " nằm trong " là đúng hoặc sai nhưng không phải là sự kiện ngẫu nhiên do đó nó không có xác suất (khác 0 hoặc 1). Do đó, câu chỉ có thể được hiểu một cách có ý nghĩa là câu Bayes.Iθ[4;5]θ[4;5]


1.) Không nên là P (..) = 0.95 thay vì P (..)> 0.95? 2.) Đoạn cuối của bạn không mâu thuẫn với mô tả chính thức của bạn? CI thường xuyên không nên là P (\ theta \ in I | \ theta) \ in \ {0,1}? Bản thân bạn nói "Trong phân tích thường xuyên" nằm trong [4; 5] "là đúng hoặc sai", nhưng mô tả chính thức của bạn nói rằng đó là "> 0,95"?
HOSS_JFL

2

Một phần của sự khác biệt là do điều hòa, sự khác biệt giữa xác suất trước dữ liệu và xác suất sau dữ liệu. Trước khi bạn thực hiện thử nghiệm duy nhất của mình (trước khi bạn lấy mẫu), bạn biết rằng có 95% khả năng 95% CI sẽ chứa giá trị trung bình thực (đây là định nghĩa của 95% CI). Tuy nhiên, sau khi bạn lấy được mẫu của mình, bạn ở trạng thái kiến ​​thức khác: bạn chưa học được ý nghĩa thực sự, nhưng bạn đã thấy một mẫu dữ liệu cụ thể, có thể cung cấp cho bạn một số kiến ​​thức mới và có thể ảnh hưởng đến tính toán xác suất của bạn.

Tương tự, trước khi bạn rút thẻ, bạn biết rằng có 25% khả năng thẻ sẽ là một câu lạc bộ. Bây giờ để làm cho sự tương tự hoạt động, bạn không thể tìm hiểu sự phù hợp thực sự của thẻ khi bạn rút nó (vì tương tự như vậy, ý nghĩa thực sự luôn bị ẩn khỏi bạn). Nhưng bạn có thể học được điều gì đó mới từ việc vẽ thẻ, ví dụ như màu của bộ đồ.

Giả sử bạn rút thẻ và thông qua một số cơ chế (không thành vấn đề), bạn biết rằng thẻ đó là từ một bộ đồ màu đen. Điều này thay đổi xác suất của bạn: từ thông tin trước, bạn biết rằng các câu lạc bộ là màu đen và một nửa số thẻ là từ bộ đồ đen, vì vậy bây giờ bạn biết rằng thẻ có 50% cơ hội là một câu lạc bộ. Mặt khác, nếu bạn phát hiện ra một thẻ đỏ, từ thông tin trước đó của bạn, bạn biết rằng các câu lạc bộ không phải là màu đỏ, vì vậy bây giờ bạn sẽ biết rằng có 0% cơ hội thẻ của bạn là một câu lạc bộ. Cả hai xác suất này đều phù hợp với 25% cơ hội của một câu lạc bộ trước khi rút thẻ.

Nếu bạn đã bỏ qua thông tin trước đó của mình hoặc nếu bạn không được thông báo rằng thẻ có màu đen, bạn vẫn có 25% cơ hội chính xác. Tuy nhiên, bạn có thể làm tốt hơn nếu bạn tận dụng thông tin trước đó của mình.

Có nhiều ví dụ về điều này với các TCTD thực, trong đó việc xem dữ liệu đưa ra xác suất bao phủ khác với% CI. Ví dụ kinh điển này (nửa bài đăng) của một CI "gây hiểu lầm" từ David McKay có thể giúp ích. Một ví dụ tương tự được đưa ra bởi Berger .

Để tiếp tục với ví dụ về chiều cao của mọi người: giả sử bạn biết rằng dân số bạn đang học là từ Hà Lan, nơi có chiều cao trung bình cao nhất của bất kỳ quốc gia nào trên thế giới (khoảng 1.84±0.02m). Tuy nhiên, giả sử mẫu của bạn có 95% CI1.7±0.02m. Bạn vẫn nghĩ có xác suất 95% rằng dân số thực sự có nghĩa nằm trong khoảng đó? Tôi sẽ nói rằng, dựa trên kiến ​​thức trước đó, mẫu cụ thể của bạn là một con sán ngẫu nhiên và thấp bất thường. Nói cách khác, xác suất ít hơn 95% rằng giá trị trung bình thực nằm trong CI tính toán của bạn.

Lưu ý, trước khi bạn lấy mẫu và tính CI cụ thể của bạn, cơ hội bạn nhận được CI bao gồm giá trị trung bình thực là 95%. Sau đó, nếu bạn sử dụng không có thông tin trước đó, và giả định rằng tất cả các đỉnh cao là như nhau có thể xảy ra một tiên nghiệm , sau đó bạn có thể , nếu bạn muốn, làm cho một tuyên bố Bayesian rằng có 95% xác suất mà khoảng thời gian của bạn có chứa giá trị trung bình thật sự. Nhưng nhận ra rằng một tuyên bố như vậy không tuân theo định nghĩa của CI, và nó chủ yếu phụ thuộc vào một giả định cụ thể trước cho giá trị trung bình. Nó cũng phụ thuộc vào giả định về tính quy tắc của bạn, vì hầu hết các TCTD thường xuyên không thể được giải thích lại theo cách thức Bayes một cách dễ dàng.


Cảm ơn bạn đã trả lời, điều đó giúp làm sáng tỏ mọi thứ trong tâm trí của tôi. Tôi nghĩ.
dùng1718097

0

Câu hỏi của bạn là triết lý nhiều hơn thống kê. Nó đã được thảo luận về nauseam dưới dạng một con mèo trong hộp.

https://en.wikipedia.org/wiki/Schr%C3%B6dinger%27s_cat

Tôi sẽ thêm, liên quan

Khoảng tin cậy 95% nên được diễn giải theo cách lặp lại một thử nghiệm nhiều lần và khoảng thời gian tính toán sẽ chứa giá trị trung bình thực 95% của thời gian

Đây là một cách giải thích. Bạn cũng có thể nói rằng, trước khi bạn tạo khoảng, có 95% khả năng quá trình sẽ dẫn đến một khoảng bắt được giá trị trung bình thực.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.