Liệu khoảng tin cậy có thực sự cung cấp thước đo độ không đảm bảo của ước tính tham số không?


12

Tôi đã đọc một bài đăng trên blog của nhà thống kê William Briggs, và tuyên bố sau đây khiến tôi quan tâm để nói ít nhất.

Ông nghĩ gì về nó?

Khoảng tin cậy là gì? Đó là một phương trình, tất nhiên, sẽ cung cấp cho bạn một khoảng cho dữ liệu của bạn. Nó có nghĩa là để cung cấp một thước đo về độ không đảm bảo của ước tính tham số. Bây giờ, theo đúng lý thuyết thường xuyên, điều mà chúng ta thậm chí có thể cho là đúng, điều duy nhất bạn có thể nói về CI bạn có trong tay là giá trị thực của tham số nằm trong đó hoặc không. Đây là một tautology, do đó nó luôn luôn đúng. Do đó, CI không cung cấp thước đo về độ không chắc chắn: thực tế, đây là một bài tập vô dụng để tính toán.

Liên kết: http://wmbriggs.com/post/3169/


3
Không có một tài liệu tham khảo chính xác, hầu hết không có bối cảnh ở đây. Cũng không có cách nào để có được chỉ dẫn về phong cách và thông tin của William Briggs (không được biết đến với tôi). Nó có thể là ở đây một người chỉ thích khiêu khích và thái quá. Ở đây cũng có những vấn đề triết học và triết học sâu sắc và khó khăn, đó là câu hỏi, nhưng yêu cầu chúng tôi tranh luận một trích dẫn không có nền tảng là (chỉ một quan điểm) dường như không có kết quả.
Nick Cox

1
@NickCox Liên quan đến việc bỏ qua bối cảnh có liên quan, bây giờ tôi đã chỉnh sửa bài viết ban đầu.
Năm

6
Cảm ơn rất nhiều vì đã cung cấp sao lưu. Đó chỉ là một nhận xét và tôi thiếu thiên hướng để mở rộng nó, nhưng phản ứng ba từ của tôi là câu cuối cùng là một tuyên bố cường điệu . Bạn có thể hy vọng cho câu trả lời đầy đủ hơn nhiều.
Nick Cox

1
@NickCox Không có vấn đề gì Nick. Tuy nhiên, tôi đánh giá cao tình cảm của bạn vì nó cẩu thả khi không tham khảo câu hỏi của tôi.
Năm

2
@Nick Tôi sẽ nói Briggs đã thành công trong một trong hai mục tiêu của mình: "Suy nghĩ của ngày hôm nay chỉ là một bản phác thảo để giúp tôi giải tỏa tâm trí và bắt đầu một cuộc thảo luận. Có nghĩa là, tôi sẽ trở thành con mồi của chính mình" nhà thống kê "là một" nhà tư tưởng cẩu thả ").
whuber

Câu trả lời:


24

Thay vào đó, anh ta đề cập đến một thực tế nổi tiếng rằng phân tích thường xuyên không mô hình hóa trạng thái hiểu biết của chúng ta về một tham số chưa biết với phân phối xác suất, do đó, đã tính khoảng tin cậy (giả sử là 95%) (nói 1,2 đến 3,4) cho một tham số dân số (giả sử giá trị trung bình của phân phối Gaussian) từ một số dữ liệu bạn không thể tiếp tục và tuyên bố rằng có xác suất 95% của giá trị trung bình nằm trong khoảng từ 1,2 đến 3,4. Xác suất là một hoặc không 0 bạn không biết điều đó. Nhưng những gì bạn có thể nói, nói chung, là quy trình tính khoảng tin cậy 95% của bạn là một quy trình đảm bảo chúng chứa giá trị tham số thực 95% thời gian. Điều này có vẻ đủ lý do để nói rằng các TCTD phản ánh sự không chắc chắn. Như Ngài David Cox đã nói

Chúng tôi xác định các quy trình đánh giá bằng chứng được hiệu chỉnh bằng cách chúng sẽ thực hiện được sử dụng nhiều lần. Theo nghĩa đó, chúng không khác với các dụng cụ đo lường khác.

Xem tại đây & ở đây để giải thích thêm.

Những điều khác bạn có thể nói khác nhau tùy theo phương pháp cụ thể bạn đã sử dụng để tính khoảng tin cậy; nếu bạn đảm bảo các giá trị bên trong có khả năng lớn hơn, được cung cấp dữ liệu, hơn các điểm bên ngoài, thì bạn có thể nói rằng (& nó thường gần đúng với các phương thức thường được sử dụng). Xem ở đây để biết thêm.

Cox (2006), Nguyên tắc suy luận thống kê , §1.5.2


1
Đó là Ngài David Cox, tôi tưởng tượng.
Nick Cox

@NickCox: Quả thực là vậy.
Scortchi - Phục hồi Monica

Sự tương tự của Ngài David có được trích dẫn đúng không? (Không phải là một trích dẫn chính xác, nhưng một sự tương tự chính xác.) Tôi không tưởng tượng được một nhiệt kế đó 95% thời gian báo cáo nhiệt độ , nhưng 5% thời gian báo cáo bên ngoài nhiệt độ ± ε - và có lẽ xa ngoài phạm vi đó? ±ϵ±ϵ
Wayne

1
@Spectrosaurus: Các bài đăng tôi liên kết để đi sâu vào chi tiết này. Trong phạt tiền, dân số có nghĩa là không được mô hình hóa như một biến ngẫu nhiên; dữ liệu X μ là, với một bản phân phối mà phụ thuộc vào μ , và khoảng tin cậy ( b L ( X μ ) , b U ( X μ ) ) là một chức năng của dữ liệu. Pr [ b U ( X μ ) < μ < b U ( X μ )μXμμ(bL(Xμ),bU(Xμ)) xác định khoảng tin cậy hợp lệ với độ bao phủ 95%, bất kỳ giá trị nào μ có thể có. Vì vậy, nếu μ = 2 , ...Pr[bU(Xμ)<μ<bU(Xμ)]=0.95μμ=2
Scortchi - Khôi phục Monica

1
... là đúng, và nếu μ = 7 , Pr [ b U ( X 7 ) < 7 < b U ( X 1,2 < μ < 3,4 ] = 0,95 , tức là nếu μ = 2 ,Pr[bU(X2)<2<bU(X2)]=0.95μ=7 là đúng. Bây giờ thay thế các giá trị thực của X μ cho ví dụ PrPr[bU(X7)<7<bU(X7)]=0.95Xμ Pr [ 1,2 < 2 < 3,4 ] = 0,95 và nếu μ = 7 , Pr [ 1,2 < 2 < 3,4 ] = 0,95 - là vô nghĩa. Pr[1.2<μ<3.4]=0.95μ=2Pr[1.2<2<3.4]=0.95μ=7Pr[1.2<2<3.4]=0.95
Scortchi - Phục hồi Monica

2

Có thể khó để mô tả tính không chắc chắn về mặt toán học, nhưng tôi biết điều đó khi tôi nhìn thấy nó; nó thường có khoảng tin cậy rộng 95%.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.