Có phải tất cả các giá trị trong khoảng tin cậy 95% đều giống nhau không?


56

Tôi đã tìm thấy thông tin trái ngược nhau về vấn đề: " Nếu một người xây dựng một khoảng tin cậy 95% (CI) của một sự khác biệt trong phương tiện hoặc một sự khác biệt trong tỷ lệ, tất cả đều giá trị trong CI đều có khả năng? Hoặc là ước lượng điểm nhiều khả năng nhất , với các giá trị gần "đuôi" của CI ít có khả năng hơn các giá trị ở giữa CI?

Ví dụ, nếu một báo cáo thử nghiệm lâm sàng ngẫu nhiên nói rằng nguy cơ tử vong tương đối với một điều trị cụ thể là 1,06 (95% CI 0,96 đến 1,18), thì khả năng 0,96 có phải là giá trị chính xác giống như 1,06 không?

Tôi đã tìm thấy nhiều tài liệu tham khảo về khái niệm này trực tuyến, nhưng hai ví dụ sau đây phản ánh sự không chắc chắn trong đó:

  1. Mô-đun của Lisa Sullivan về các khoảng tin cậy :

    Khoảng tin cậy cho sự khác biệt về phương tiện cung cấp một phạm vi các giá trị có khả năng cho ( ). Điều quan trọng cần lưu ý là tất cả các giá trị trong khoảng tin cậy đều là các ước tính có khả năng như nhau về giá trị thực của ( ).μ1μ2μ1μ2

  2. Blogpost này, có tiêu đề Trong phạm vi lỗi , nêu rõ:

    Những gì tôi có trong tâm trí là sự hiểu lầm về biên độ lỗi của lỗi mà xử lý tất cả các điểm trong khoảng tin cậy là như nhau, như thể định lý giới hạn trung tâm ngụ ý phân phối đồng đều giới hạn thay vì phân phối t . [...]
    Điều nói về biên độ lỗi của lỗi Lỗi bỏ lỡ là các khả năng gần với ước tính điểm có nhiều khả năng hơn các khả năng nằm ở rìa của lề ".

Những điều này có vẻ mâu thuẫn, vậy cái nào đúng?


7
Tôi tự hỏi liệu có sự nhầm lẫn ở đâu đó với khái niệm liên quan rằng giá trị p được phân phối đồng đều theo giả thuyết null ..
Michael McGowan

4
Báo giá đầu tiên là một phiếu bất thường trong một tài khoản chính xác về các khoảng tin cậy. Trích dẫn thứ hai là từ một tài khoản, nói một cách độc đáo, là một mớ hỗn độn cẩu thả: nó chứa đầy những tuyên bố mơ hồ, không chính xác hoặc chỉ có thể được hiểu theo nghĩa Bayes. Nhưng cả hai trích dẫn đều sai !
whuber

@whuber Tôi sẽ không gọi cái thứ hai là một mớ hỗn độn ... Tôi sẽ gọi nó là một cách giải thích Bayes về cách giải thích thường xuyên :)
Michael McGowan

1
@Michael Một ví dụ về sự chậm chạp là một chủ nghĩa độc đoán như khẳng định CLT ngụ ý "vô số ước tính lặp lại của [dân số] có nghĩa vẫn sẽ tuân theo phân phối bình thường." Người ta không phải sai để truyền đạt ý tưởng đơn giản đến khán giả phi kỹ thuật.
whuber

2
@whuber, tôi coi câu bạn chỉ trích dẫn là một tội nhỏ. Lỗi chính là CLT không liên quan đến phân phối t.
thủy tinh

Câu trả lời:


23

Một câu hỏi cần được trả lời là "có khả năng" nghĩa là gì trong bối cảnh này?

Nếu nó có nghĩa là xác suất (vì đôi khi nó được sử dụng như một từ đồng nghĩa của) và chúng tôi đang sử dụng các định nghĩa thường xuyên nghiêm ngặt thì giá trị tham số thực là một giá trị không thay đổi, vì vậy xác suất (khả năng) của điểm đó là 100% và tất cả các giá trị khác là 0%. Vì vậy, hầu như tất cả đều có khả năng bằng nhau ở mức 0%, nhưng nếu khoảng chứa giá trị thực, thì nó khác với các giá trị khác.

Nếu chúng ta sử dụng cách tiếp cận Bayes thì CI (Khoảng tin cậy) xuất phát từ phân phối sau và bạn có thể so sánh khả năng tại các điểm khác nhau trong khoảng. Trừ khi hậu thế hoàn toàn thống nhất trong khoảng (theo lý thuyết tôi có thể đoán được, nhưng đó sẽ là một tình huống kỳ lạ) thì các giá trị có khả năng khác nhau.

Nếu chúng ta sử dụng có khả năng tương tự như độ tin cậy thì hãy nghĩ về nó theo cách này: Tính khoảng tin cậy 95%, khoảng tin cậy 90% và khoảng tin cậy 85%. Chúng tôi sẽ tin tưởng 5% rằng giá trị thực nằm ở khu vực bên trong khoảng 95% nhưng ngoài khoảng 90%, chúng tôi có thể nói rằng giá trị thực có khả năng giảm 5% trong khu vực đó. Điều tương tự cũng đúng với khu vực nằm trong khoảng 90% nhưng nằm ngoài khoảng 85%. Vì vậy, nếu mọi giá trị đều có khả năng như nhau, thì kích thước của 2 vùng trên sẽ cần phải giống hệt nhau và tương tự sẽ đúng với vùng trong khoảng tin cậy 10% nhưng nằm ngoài khoảng tin cậy 5%. Không có phân phối chuẩn nào mà các khoảng được xây dựng sử dụng có thuộc tính này (ngoại trừ các trường hợp đặc biệt với 1 lần rút từ đồng phục).

Bạn có thể tự mình chứng minh điều này bằng cách mô phỏng một số lượng lớn các bộ dữ liệu từ các quần thể đã biết, tính toán khoảng tin cậy quan tâm, sau đó so sánh tần suất của tham số thực gần với ước tính điểm hơn so với từng điểm cuối.


3
Khả năng là những gì câu hỏi này cần trong câu trả lời, không phải xác suất, thường xuyên hoặc Bayesian. Khả năng cung cấp chính xác câu trả lời, những người khác chỉ có thể làm như vậy với một số xoắn và kéo dài.
Michael Lew

1
@Greg Tôi thích lời giải thích của bạn. Nói rõ hơn, lập luận của bạn ủng hộ quan niệm rằng các giá trị ở "đuôi" của 95% CI ít có khả năng (ít xác suất hơn) so với các giá trị gần với ước tính điểm hơn, đúng không? Cám ơn phản hồi của bạn.
pmgjones

1
@pmgjones ít có xác suất, KHÔNG, xem đoạn 2. Ít có khả năng trong bối cảnh của đoạn thứ 4, Có.
Greg Snow

2
@GregSnow Đoạn thứ 2 của bạn nói gần như chính xác rằng xác suất của tham số thực là tham số thực là 100%. Bạn có thực sự tin rằng tautology này là những gì "định nghĩa thường xuyên nghiêm ngặt" phải cung cấp?
rolando2

2
@ rolando2, tôi nghĩ rằng số liệu thống kê thường xuyên có nhiều thứ để cung cấp, tôi chỉ loại bỏ những sai lầm phổ biến ngụ ý thay đổi giá trị thực và đôi khi nằm ngoài khoảng và đôi khi nằm trong khoảng (đôi khi gần với ranh giới hơn và đôi khi gần hơn với trung tâm). Các đoạn sau đó có được cảm giác chân thực hơn cho các ý tưởng.
Greg Snow

19

Đây là một câu hỏi hay! Có một khái niệm toán học gọi là khả năng sẽ giúp bạn hiểu các vấn đề. Fisher đã phát minh ra khả năng nhưng coi nó là ít mong muốn hơn xác suất, nhưng khả năng hóa ra là 'nguyên thủy' hơn xác suất và Ian Hacking (1965) coi đó là tiên đề ở chỗ không thể chứng minh được. Khả năng củng cố xác suất thay vì ngược lại.

Hacking, năm 1965. Logic của suy luận thống kê .

Khả năng không được chú ý mà nó nên có trong sách giáo khoa thống kê tiêu chuẩn, không có lý do chính đáng. Nó khác với xác suất trong việc có gần như chính xác các thuộc tính mà người ta mong đợi, và các hàm và khoảng có khả năng rất hữu ích cho suy luận. Có lẽ khả năng không được một số nhà thống kê ưa thích vì đôi khi không có cách 'phù hợp' để rút ra các chức năng khả năng có liên quan. Tuy nhiên, trong nhiều trường hợp, các hàm khả năng là rõ ràng và được xác định rõ. Một nghiên cứu về khả năng suy luận có lẽ nên bắt đầu với cuốn sách nhỏ và dễ hiểu của Richard Royall có tên là Bằng chứng thống kê: Nghịch lý khả năng .

Câu trả lời cho câu hỏi của bạn là không, các điểm trong bất kỳ khoảng nào đều không có khả năng giống nhau. Những người ở rìa của khoảng tin cậy thường có khả năng thấp hơn những người khác về phía trung tâm của khoảng. Tất nhiên, khoảng tin cậy thông thường không cho bạn biết gì trực tiếp về thông số liên quan đến thử nghiệm cụ thể. Khoảng tin cậy của Neyman là 'toàn cầu' ở chỗ chúng được thiết kế để có các thuộc tính dài hạn thay vì các thuộc tính 'cục bộ' có liên quan đến thử nghiệm trong tay. (Hạnh phúc hiệu suất dài hạn có thể được giải thích tại địa phương, nhưng đó là một lối tắt trí tuệ chứ không phải là thực tế toán học.) Khả năng xen kẽ trong trường hợp chúng có thể được xây dựng trực tiếp phản ánh khả năng liên quan đến thử nghiệm trong tay.


1
@suncoolsu Không nhất thiết khoảng thời gian trong câu hỏi là khoảng khả năng cho câu lệnh là đúng. Khoảng chỉ phải trải dài ước tính có khả năng nhất sao cho giới hạn khoảng là mỗi điểm ít có khả năng hơn một điểm trong khoảng. Bất kỳ khoảng tin cậy thông thường sẽ đáp ứng yêu cầu đó.
Michael Lew

2
@pmjones KIỂM TRA 95% KHÔNG cho bạn biết nếu các giá trị đối với lề của CI gần với sự thật hơn các giá trị ở giữa. Các TCTD đưa ra tuyên bố về việc lấy mẫu lặp lại từ dân số. Về lâu dài (nghĩa là, sau khi lấy mẫu lặp lại), 95% các TCTD đó, được xây dựng cho từng mẫu, sẽ bao gồm giá trị thực. Do đó, có hai quan sát chính 1) Người ta không thể nói bất cứ điều gì về giá trị thực của CI 2) Các TCTD không cho bạn biết bất cứ điều gì về dữ liệu được quan sát, đó là một chỉ trích thông thường của Bayes.
suncoolsu

1
@MichaelLew Nguyên tắc khả năng sống rất hữu ích, nhưng tôi đã nói rằng (trích dẫn LW) "Thật vậy, tất cả những suy luận thường xuyên đều vi phạm LP, vì vậy nếu chúng ta tuân thủ LP, chúng ta sẽ phải từ bỏ suy luận thường xuyên." Bởi vì CI là một ý tưởng thường xuyên, nó vi phạm LP (mà bạn nói là cơ bản).
suncoolsu

1
@suncollsu Câu hỏi không phải là liệu khoảng tin cậy đơn thuần và không có bất kỳ cân nhắc thống kê nào khác cho biết bất cứ điều gì về khả năng của các giá trị tham số trong chính nó. Đó là về khả năng của các giá trị tham số trong khoảng. Hàm khả năng trả lời câu hỏi và câu trả lời đó là chính xác ngay cả khi khoảng tin cậy vi phạm nguyên tắc khả năng. (Đọc bình luận trước đó của tôi một lần nữa. Bạn dường như đã bỏ qua hoàn toàn nội dung của nó.)
Michael Lew

2
@ rolando2 Khoảng tin cậy 95% của Neyman được thiết kế sao cho phương thức chứa tham số thực trong 95% các trường hợp phương thức được sử dụng. Nói một cách chính xác sự tự tin gắn liền với phương pháp chứ không phải bất kỳ khoảng riêng lẻ nào và do đó, khoảng thời gian riêng lẻ không cho bạn biết bất cứ điều gì về tình trạng của thế giới trong thí nghiệm cụ thể đó. Xem câu trả lời của tôi cho câu hỏi này để biết thêm chi tiết: stats.stackexchange.com/questions/8844/iêu
Michael Lew

18

Giả sử ai đó nói với tôi rằng tôi nên đặt niềm tin ngang nhau vào tất cả các giá trị trong CI95 làm chỉ số tiềm năng của giá trị dân số. (Tôi cố tình tránh các thuật ngữ "có khả năng" và "có thể xảy ra.") Điều gì đặc biệt về 95? Không có gì: để thống nhất, tôi cũng sẽ phải đặt niềm tin ngang nhau vào tất cả các giá trị trong CI96, CI97, ... và CI99.9999999. Khi phạm vi bảo hiểm của CI tiến gần đến giới hạn của nó, hầu như tất cả các số thực sẽ phải được đưa vào. Sự vô lý của kết luận này sẽ khiến tôi từ chối yêu cầu ban đầu.


4
Đây là một câu trả lời tuyệt vời! Tôi nên nghĩ về tác động của việc tiếp cận các thái cực của các TCTD có thể. Cảm ơn đã viết bài này!
pmgjones

2

Hãy bắt đầu với định nghĩa về khoảng tin cậy. Nếu tôi nói rằng khoảng tin cậy 95% đi từ điều này đến điều đó có nghĩa là những tuyên bố về bản chất đó sẽ đúng khoảng 95% và sai khoảng 5% thời gian. Tôi không nhất thiết có nghĩa là tôi tự tin 95% về tuyên bố cụ thể này . Khoảng tin cậy 90% sẽ hẹp hơn và hẹp hơn 80%. Do đó, khi tự hỏi giá trị thực sự là gì, tôi có ít tín nhiệm hơn về các giá trị khi chúng càng ngày càng gần với cạnh của bất kỳ khoảng tin cậy cụ thể nào.

Lưu ý rằng tất cả những điều trên là định tính, đặc biệt là "sự tín nhiệm". (Tôi tránh thuật ngữ "tự tin" hoặc "khả năng" trong tuyên bố đó vì chúng mang theo hành lý toán học có thể khác với hành lý trực quan của chúng tôi.) Cách tiếp cận của Bayes sẽ viết lại câu hỏi của bạn thành câu trả lời định lượng nhưng tôi không muốn mở đó có thể là giun ở đây

Văn bản kinh điển của Box, Hunter & Hunter ("Thống kê cho các thí nghiệm", Wiley, 1978) cũng có thể giúp ích. Xem "Bộ khoảng tin cậy" trên trang 113, ff.


Vì chúng ta đang xử lý một phần trong các khái niệm và một phần về ngữ nghĩa, tôi sẽ chỉ ra rằng trong câu thứ hai của bạn, bạn đã nói "... những phát biểu về bản chất đó sẽ đúng ..." mà không xác định câu nào là đúng.
rolando2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.