Giải thích khoảng tin cậy


15

Lưu ý: xin lỗi trước nếu đây là bản sao, tôi không tìm thấy q tương tự trong tìm kiếm của mình

Nói rằng chúng ta có một tham số đúng p. Khoảng tin cậy C (X) là RV chứa p, chiếm 95% thời gian. Bây giờ giả sử chúng ta quan sát X và tính C (X). Câu trả lời chung dường như là không chính xác khi giải thích điều này là có "95% cơ hội chứa p" vì nó "hoặc là không hoặc nó không chứa p"

Tuy nhiên, giả sử tôi chọn một thẻ từ trên đỉnh của một cỗ bài xáo trộn và để nó úp xuống. Theo trực giác, tôi nghĩ rằng xác suất của lá bài này là Ace of Spades là 1/52, mặc dù trong thực tế "nó có hoặc không phải là Ace of Spades." Tại sao tôi không thể áp dụng lý do này vào ví dụ về khoảng tin cậy?

Hoặc nếu không có ý nghĩa khi nói về "xác suất" của thẻ là ace of spades vì ​​nó "hoặc không", tôi vẫn sẽ đặt tỷ lệ cược 51: 1 rằng đó không phải là ace of spades. Có một từ khác để mô tả thông tin này? Khái niệm này khác với "xác suất" như thế nào?

chỉnh sửa: Có thể rõ ràng hơn, từ cách giải thích xác suất của Bayes, nếu tôi nói rằng một biến ngẫu nhiên chứa p 95% thời gian, được đưa ra nhận thức về biến ngẫu nhiên đó (và không có thông tin nào khác để điều kiện) đúng để nói biến ngẫu nhiên có xác suất 95% chứa p?

chỉnh sửa: đồng thời, từ cách giải thích xác suất thường xuyên, giả sử người thường xuyên đồng ý không nói bất cứ điều gì như "có xác suất 95% rằng khoảng tin cậy chứa p". Vẫn còn logic cho một người thường xuyên có "sự tự tin" rằng khoảng tin cậy có chứa p?

Đặt alpha là mức ý nghĩa và đặt t = 100-alpha. K (t) là "độ tin cậy" thường xuyên mà khoảng tin cậy chứa p. Nó có ý nghĩa rằng K (t) nên tăng theo t. Khi t = 100%, người thường xuyên phải có sự chắc chắn (theo định nghĩa) rằng khoảng tin cậy chứa p, vì vậy chúng ta có thể chuẩn hóa K (1) = 1. Tương tự, K (0) = 0. Có lẽ K (0.95) nằm ở giữa 0 và 1 và K (0,999999) là lớn hơn. Theo cách nào thì người thường xuyên coi K khác với P (phân phối xác suất)?


1
Thật vậy, hãy xem xét một đồng xu lật trong đó đồng xu lăn dưới bàn, ngoài tầm nhìn và chúng tôi xem xét sự kiện mà đồng xu rơi xuống đầu. Thoạt nhìn, điều này có vẻ rất giống với vấn đề CI - rõ ràng là sự kiện đã xảy ra hoặc nó đã không xảy ra. Tuy nhiên, trong trường hợp lật đồng xu, nhiều người (có lẽ thậm chí là hầu hết) có vẻ hoàn toàn vui mừng khi gán xác suất đáng chú ý, (nói p ) cho đồng tiền không quan sát được đã kết thúc trên đầu, trong khi lùi lại khi nói điều tương tự về khoảng ngẫu nhiên có chứa tham số. Đối với tôi dường như có một sự không nhất quán.
Glen_b -Reinstate Monica

@Glen_b Những người thường xuyên trong kịch bản đồng xu bị bỏ rơi không quan sát được áp dụng lý do không chính xác để nói, không phải là mệnh giá thực tế của đồng tiền là "ngẫu nhiên" (mặc dù nó không quan sát được), nhưng chúng ta có thể khái quát bất kỳ kết quả quan sát nào đối với các kết quả tiềm năng khác trong việc giảm này xu và tính xác suất. Theo như xác suất đối với mệnh giá thực tế của đồng tiền, thì nó có hoặc không đứng đầu, không có xác suất. Các p được lưu cho việc xây dựng đối chứng của thiết lập này.
AdamO

@Glen_b: Tôi đồng ý, xem câu hỏi của tôi ở đây: stats.stackexchange.com/questions/233588/ mẹo
vonjd

@vonjd đến mức nào là câu hỏi của bạn ở đó không chỉ đơn giản là một bản sao của đoạn đầu tiên sau khi mở "Lưu ý:" ở đây?
Glen_b -Reinstate Monica

@Glen_b: Thành thật mà nói tôi không biết câu hỏi này khi tôi đăng bài của tôi và chúng chắc chắn trùng nhau. Tuy nhiên, tôi nghĩ rằng chúng không trùng lặp bởi vì tôi thường quan tâm đến việc sử dụng xác suất cho các kết quả ẩn (điều này sẽ có hậu quả cho khoảng tin cậy) trong khi điều này hoàn toàn nhắm vào các khoảng tin cậy. Nhưng nếu bạn nghĩ rằng tôi là một bản sao, hãy đóng nó lại.
vonjd

Câu trả lời:


8

Tôi nghĩ rằng rất nhiều tài khoản thông thường về vấn đề này không rõ ràng.

Hãy nói rằng bạn lấy một mẫu có kích thước và nhận được khoảng tin cậy 95 % cho p .10095%p

Sau đó, bạn lấy một mẫu khác là , độc lập với mẫu đầu tiên và nhận khoảng tin cậy 95 % khác cho p .10095%p

Những thay đổi là khoảng tin cậy; những gì không thay đổi là . p Điều đó có nghĩa là trong các phương pháp thường xuyên, người ta nói khoảng tin cậy là "ngẫu nhiên" nhưng là "cố định" hoặc "không đổi", tức là không ngẫu nhiên. Trong các phương pháp thường xuyên, chẳng hạn như phương pháp khoảng tin cậy, người ta chỉ gán xác suất cho những thứ ngẫu nhiên.p

Vậy ( L , U ) là khoảng tin cậy. ( L = "dưới" và U = "trên".) Lấy một mẫu mới và LU thay đổi nhưng p thì không.Pr(L<p<U)=0.95(L,U)L=U=LUp

Giả sử trong một trường hợp cụ thể, bạn có U = 43,61 . Trong phương pháp frequentist người ta sẽ không gán một xác suất để báo cáo kết quả 40,53 < p < 43,61 , khác hơn là một xác suất 0 hoặc 1 , bởi vì không có gì ở đây là ngẫu nhiên: 40,53 không phải là ngẫu nhiên, p không phải là ngẫu nhiên (vì nó sẽ không thay đổi nếu chúng tôi lấy một mẫu mới) và 43,61 không phải là ngẫu nhiên.L=40.53U=43.6140.53<p<43.610140.53p43.61

Trong thực tế, mọi người hành xử như thể họ chắc chắn rằng p nằm trong khoảng từ 40,53 đến 43,61 . Và như một vấn đề thực tế, điều đó thường có thể có ý nghĩa. Nhưng đôi khi không. Một trường hợp như vậy là nếu các số lớn từ 40 trở lên được biết trước là không thể thực hiện được, hoặc nếu chúng được biết là có khả năng cao. Nếu người ta có thể gán một số phân phối xác suất trước cho p , người ta sẽ sử dụng định lý Bayes để có được khoảng tin cậy, có thể khác với khoảng tin cậy do kiến ​​thức trước về phạm vi giá trị của p95%p40.5343.6140ppcó thể xảy ra hoặc không thể. Nó cũng thực sự có thể xảy ra rằng chính dữ liệu --- những thứ thay đổi nếu lấy một mẫu mới, có thể cho bạn biết rằng không có khả năng, hoặc thậm chí chắc chắn là không lớn đến 40 . Điều đó có thể xảy ra ngay cả trong trường hợp cặp ( L , U ) là một thống kê đủ cho p . Hiện tượng đó có thể được xử lý trong một số trường hợp bằng phương pháp điều hòa của Fisher trên một thống kê phụ trợ. Một ví dụ về hiện tượng cuối cùng này là khi mẫu bao gồm chỉ hai quan sát độc lập mà được phân bố đều trong khoảng q ± 1 / 2p40(L,U)pθ±1/2. Sau đó, khoảng cách từ nhỏ hơn trong hai quan sát đến lớn hơn là khoảng tin cậy . Nhưng nếu khoảng cách giữa chúng là 0,001 , nó sẽ là vô lý là bất cứ nơi nào gần 50 % chắc chắn rằng θ là giữa chúng, và nếu khoảng cách là 0,999 , người ta sẽ hợp lý được gần như 100 % chắc chắn θ là giữa chúng. Khoảng cách giữa chúng sẽ là thống kê phụ trợ mà người ta sẽ điều kiện.50%0.00150%θ0.999100%θ


Cảm ơn Michael mà rất có ý nghĩa. Giả sử trong ví dụ của bạn rằng chúng ta có một (L, U) cụ thể nhưng các giá trị không được biết đến với chúng ta. Tất cả những gì chúng ta biết là đó là việc thực hiện biến ngẫu nhiên khoảng tin cậy 95%. Nếu không có bất kỳ ưu tiên nào về tham số hoặc bất kỳ thông tin nào khác, liệu có công bằng khi đặt tỷ lệ cược 19: 1 mà (L, U) chứa tham số không? Nếu một người thường xuyên sẵn sàng làm điều này, nhưng không gọi "sẵn sàng đặt tỷ lệ 19: 1" của mình rằng nó chứa tham số "một" xác suất ", chúng ta sẽ gọi nó là gì?
ứng

Vâng, xác suất đó là . Chắc chắn trong các phương pháp thường xuyên, người ta có thể nói rằng trong trạng thái không biết ( L , U ) xác suất là 0,95 mà khoảng đó chứa p . Nhưng khi một người có các giá trị cụ thể, không phải là ngẫu nhiên, người thường xuyên sẽ không gán một giá trị khác 0 hoặc 1 cho câu lệnh, vì các giá trị đã biết của LU không phải là ngẫu nhiên. 0.95(L,U)0.95p01LU
Michael Hardy

3

Định nghĩa sách giáo khoa về khoảng tin cậy % là:100×(1α)

Một khoảng thời gian, theo nhiều bản sao độc lập của nghiên cứu trong các điều kiện lý tưởng, nắm bắt được phép đo hiệu ứng nhân rộng % thời gian.100×(1α)

Xác suất, đối với những người thường xuyên, xuất phát từ khái niệm "tua lại thời gian và không gian" để sao chép các phát hiện, như thể vô số bản sao của thế giới được tạo ra để đánh giá một phát hiện khoa học hết lần này đến lần khác. Vì vậy, một xác suất là một tần số chính xác. Đối với các nhà khoa học, đây là một cách rất thuận tiện để thảo luận về các phát hiện, vì nguyên tắc đầu tiên của khoa học là các nghiên cứu phải được nhân rộng.

Trong ví dụ về thẻ của bạn, sự nhầm lẫn cho Bayes và Người thường xuyên là người thường xuyên không gán xác suất cho mệnh giá của thẻ cụ thể mà bạn đã lật từ bộ bài trong khi Bayesian sẽ. Người thường xuyên sẽ chỉ định xác suất cho một thẻ, lật từ đỉnh của bộ bài xáo trộn ngẫu nhiên. Một người Bayes không quan tâm đến việc sao chép nghiên cứu, một khi thẻ được lật, giờ bạn có 100% niềm tin về thẻ là gì và 0% tin rằng nó có thể mang bất kỳ giá trị nào khác. Đối với người Bayes, xác suất là thước đo niềm tin.

Lưu ý rằng người Bayes không có khoảng tin cậy vì lý do này, họ tóm tắt sự không chắc chắn bằng khoảng tin cậy .


Cảm ơn vì sự trả lời. Trong ví dụ về thẻ, cả người bay và người thường xuyên đều đồng ý rằng 51: 1 là tỷ lệ cược công bằng rằng thẻ là át chủ bài? Tương tự, đối với việc thực hiện khoảng tin cậy 95% (và không có thông tin nào khác), cả hai sẽ không đặt tỷ lệ cược 19: 1 rằng nó có chứa tham số thực không? Theo nghĩa đó, một người Bayes có thể giải thích khoảng tin cậy 95% là có 95% cơ hội chứa tham số thực không?
ứng

@applicative_x Còn một sàn pinochle thì sao? Bạn đang xem xét việc sử dụng thông tin trước. Các frequentist chỉ có thể đưa ra giả thuyết rằng xác suất là và chỉ sử dụng khuôn mặt của thẻ valueto thông báo cho dù thí nghiệm này là phù hợp hay không phù hợp với giả thuyết đó. Hiệu lực của bất kỳ loại ước tính khoảng (độ tin cậy hoặc độ tin cậy) phụ thuộc vào các giả định không thể kiểm chứng. Không có thứ gọi là thông số thực sự, đây là một cách nghĩ nguy hiểm về khoa học. Bayes không chơi với khoảng tin cậy theo định nghĩa trước đó. Đọc lại câu trả lời. p=1/52
AdamO

Cảm ơn Adam, tôi nghĩ rằng tôi vẫn còn bối rối. Giả sử tôi biết (bằng cách nhìn vào các thẻ) rằng bộ bài 52 lá là tiêu chuẩn. Tôi xáo trộn bộ bài và chọn ra 10 lá bài hàng đầu mà không cần nhìn vào chúng. Tôi không thể định nghĩa "tham số thực" trong trường hợp này là số lượng thẻ đỏ? Sau đó, bất kể Bayesian vs thường xuyên có một "tham số thực sự." Nếu tôi được phép chọn 7 thẻ một cách ngẫu nhiên, tôi cũng có thể tưởng tượng việc xây dựng khoảng tin cậy cho các thẻ đỏ #of trong số 10.
ứng

1
Một Bayes không cần phải tin rằng không có thứ gọi là giá trị thực của tham số. Bayes chỉ có nghĩa là gán xác suất cho các tuyên bố không chắc chắn, bất kể chúng là ngẫu nhiên. Một Bayesian có thể gán khả năng để tuyên bố rằng có sự sống trên sao Hỏa một tỷ năm trước. Một người thường xuyên không thể làm điều đó, vì người ta không thể nói rằng điều đó đã xảy ra trong một nửa số trường hợp. Không có gì trong đó nói rằng một người Bayes không thể tin rằng có một câu trả lời thực sự cho câu hỏi liệu có sự sống như vậy trên Sao Hỏa hay không. Xem thêm câu trả lời được đăng của tôi cho câu hỏi của bạn. 1/2
Michael Hardy

1
@AdamO: Tôi thấy ý kiến ​​của bạn khó hiểu. 'về những gì tiện ích là khái niệm "sự thật" là một sự thay đổi của chủ đề. "Chúng tôi nghĩ về sự thật là bất biến." Vậy "chúng tôi" có nghĩa là bạn và ai khác, và sự liên quan của những gì họ nghĩ là gì? "Không có nhà khoa học nào từng đi thu thập dữ liệu vì mục đích xác minh thứ gì đó đã biết." Đó dường như là một sự thay đổi khác của chủ đề. Sau đó, theo dõi một số ý kiến ​​về người thường xuyên và Bayes. Tôi không cảm thấy như đang đoán những gì bạn đang cố nói.
Michael Hardy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.