Keith Winstein,
EDIT: Chỉ cần làm rõ, câu trả lời này mô tả ví dụ được đưa ra trong Keith Winstein Trả lời về Vua với trò chơi thống kê tàn khốc. Cả hai câu trả lời Bayes và tần số đều sử dụng cùng một thông tin, đó là bỏ qua thông tin về số lượng tiền xu công bằng và không công bằng khi xây dựng các khoảng thời gian. Nếu thông tin này không bị bỏ qua, người thường xuyên nên sử dụng Khả năng phân tích Beta-Binomial tích hợp làm phân phối lấy mẫu trong việc xây dựng khoảng tin cậy, trong trường hợp đó, khoảng tin cậy Clopper-Pearson không phù hợp và cần phải sửa đổi. Một điều chỉnh tương tự sẽ xảy ra trong giải pháp Bayes.
EDIT: Tôi cũng đã làm rõ việc sử dụng đầu tiên của clopper Pearson Interval.
EDIT: than ôi, alpha của tôi là cách sai, và khoảng thời gian pearson clopper của tôi là không chính xác. Lời xin lỗi khiêm tốn nhất của tôi đến @whuber, người đã chỉ ra điều này một cách chính xác, nhưng ban đầu tôi không đồng ý và bỏ qua.
CI sử dụng phương pháp Clopper Pearson rất tốt
Nếu bạn chỉ nhận được một quan sát, thì Clopper Pearson Interval có thể được đánh giá một cách phân tích. Giả sử đồng xu xuất hiện dưới dạng "thành công" (người đứng đầu) bạn cần chọn sao choθ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
Khi các xác suất này là và , do đó Clopper Pearson CI ngụ ý rằng (và luôn luôn đúng ) khi . Khi các xác suất này là và , do đó Clopper Pearson CI ngụ ý rằng hoặc khi . Vì vậy, đối với CI 95%, chúng tôi nhận được khi vàX=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975] khi .X=0
Do đó, một người sử dụng Clopper Pearson Confidence Interval sẽ không bao giờ bị chặt đầu. Khi quan sát khoảng, về cơ bản là toàn bộ không gian tham số. Nhưng khoảng CP đang làm điều này bằng cách cung cấp bảo hiểm 100% cho khoảng thời gian được cho là 95%! Về cơ bản, những người thường xuyên "gian lận" bằng cách đưa ra khoảng tin cậy 95% so với mức anh ta / cô ta được yêu cầu đưa ra (mặc dù ai sẽ không gian lận trong tình huống như vậy? Nếu là tôi, tôi sẽ đưa ra toàn bộ [0, 1] khoảng). Nếu nhà vua yêu cầu CI chính xác 95%, phương pháp thường xuyên này sẽ thất bại bất kể điều gì thực sự xảy ra (có lẽ là một phương pháp tốt hơn tồn tại?).
Điều gì về khoảng thời gian Bayes? (cụ thể là Khoảng thời gian Bayesian Desiority (HPD) cao nhất)
Bởi vì chúng tôi biết một tiên nghiệm mà cả đầu và đuôi có thể xuất hiện, đồng phục trước là một lựa chọn hợp lý. Điều này mang lại sự phân phối sau . Bây giờ, tất cả những gì chúng ta cần làm bây giờ là tạo một khoảng với xác suất sau 95%. Tương tự như clopper pearson CI, phân phối Cummulation Beta cũng được phân tích ở đây, do đó và đặt các giá trị này thành 0.95 sẽ cho khi và khi . Vì vậy, hai khoảng đáng tin cậy là(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776) khi và khiX=0(0.224,1)X=1
Do đó, Bayes sẽ bị chặt đầu trong khoảng thời gian đáng tin cậy HPD của anh ta trong trường hợp khi anh ta nhận được đồng tiền xấu và đồng xu xấu xuất hiện ở đuôi sẽ xảy ra với cơ hội .11012+1×110≈0
Quan sát đầu tiên, Khoảng thời gian Bayes nhỏ hơn khoảng tin cậy. Một điều nữa là Bayes sẽ gần với phạm vi bảo hiểm thực tế đã nêu, 95%, so với người thường xuyên. Trên thực tế, Bayesian chỉ gần với mức độ bao phủ 95% như người ta có thể gặp phải trong vấn đề này. Và ngược lại với tuyên bố của Keith, nếu chọn đồng tiền xấu, trung bình 10 người Bayes sẽ mất đầu (không phải tất cả trong số họ, vì đồng tiền xấu phải xuất hiện trong khoảng thời gian không chứa ). 0.1
Thật thú vị, nếu khoảng thời gian CP cho 1 lần quan sát được sử dụng lặp đi lặp lại (vì vậy chúng tôi có N khoảng thời gian như vậy, mỗi lần dựa trên 1 lần quan sát) và tỷ lệ thực sự là bất cứ thứ gì trong khoảng từ đến , thì tỷ lệ bao phủ của CI 95% sẽ luôn là 100 %, và không phải 95%! Điều này rõ ràng phụ thuộc vào giá trị thực của tham số! Vì vậy, đây là ít nhất một trường hợp trong đó việc sử dụng lặp lại khoảng tin cậy không dẫn đến mức độ tin cậy mong muốn.0.0250.975
Để trích dẫn khoảng tin cậy 95% chính hãng , thì theo định nghĩa , cần có một số trường hợp (tức là ít nhất một) khoảng thời gian quan sát không chứa giá trị thực của tham số . Nếu không, làm thế nào người ta có thể biện minh cho thẻ 95%? Nó sẽ không chỉ là một hợp lệ hoặc không hợp lệ để gọi nó là một khoảng 90%, 50%, 20% hoặc thậm chí 0%?
Tôi không thấy cách đơn giản chỉ ra "nó thực sự có nghĩa là 95% trở lên" mà không có giới hạn miễn phí là thỏa đáng. Điều này là do giải pháp toán học rõ ràng là toàn bộ không gian tham số và vấn đề là không đáng kể. giả sử tôi muốn có 50% CI? nếu nó chỉ giới hạn các phủ định sai thì toàn bộ không gian tham số là một CI hợp lệ chỉ sử dụng tiêu chí này.
Có lẽ một tiêu chí tốt hơn là (và đây là điều tôi tin là ẩn ý trong định nghĩa của Kieth) "càng gần 95% càng tốt, mà không phải dưới 95%". Khoảng thời gian Bayes sẽ có phạm vi bảo hiểm gần hơn 95% so với người thường xuyên (mặc dù không nhiều) và sẽ không đạt dưới 95% trong phạm vi bảo hiểm ( phạm vi bảo hiểm khi và phạm vi bảo hiểm khi ).100%X=0100×1012+9101012+1%>95%X=1
Cuối cùng, có vẻ hơi kỳ quặc khi yêu cầu một khoảng không chắc chắn, và sau đó đánh giá khoảng đó bằng cách sử dụng giá trị thực mà chúng ta không chắc chắn. Một so sánh "công bằng hơn", đối với cả khoảng tin cậy và khoảng tin cậy, đối với tôi có vẻ như sự thật của tuyên bố về sự không chắc chắn được đưa ra với khoảng đó .