Khoảng tin cậy xung quanh ước tính nhị thức là 0 hoặc 1


36

Kỹ thuật tốt nhất để tính khoảng tin cậy của thí nghiệm nhị thức là gì, nếu ước tính của bạn là (hoặc tương tự ) và cỡ mẫu tương đối nhỏ, ví dụ ?p = 1 n = 25p= =0p= =1n= =25


Làm thế nào gần với không là ? Là số 0 thường xuyên, hoặc theo thứ tự 0,001 hoặc 0,01 hoặc ...? Và bạn có bao nhiêu dữ liệu? p^
jbowman

Chúng tôi thường có hơn 800 thử nghiệm. Chúng tôi thường mong đợi 0 đến 0,1 chop^
AI2.0

Sử dụng Clopper mật Pearson khoảng thời gian bạn liên kết. Nguyên tắc chung: Trước tiên hãy thử Clopper Gian Pearson. Nếu máy tính không thể có câu trả lời, hãy thử phương pháp gần đúng, chẳng hạn như xấp xỉ bình thường. Theo tốc độ máy tính hiện tại, tôi không nghĩ rằng chúng ta cần xấp xỉ trên hầu hết các tình huống.
dùng158565

Để chỉ nhận giới hạn trên của khoảng tin cậy với ( độ tin cậy 1- , chúng tôi sẽ chỉ sử dụng B (1− ; x + 1, n − x) trong đó x là số lần thành công (hoặc thất bại), n là cỡ mẫu. Trong python, chúng ta chỉ sử dụng . Nếu đây là TRUE, chúng ta có thể kết luận rằng chúng ta là 1 tự tin rằng giới hạn trên được giới hạn bởi giá trị mà chúng ta tính toán từ ?alpha alphaααscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) αscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
AI2.0

1
Với 800 thử nghiệm, xấp xỉ Bình thường thông thường sẽ hoạt động hợp lý xuống khoảng (mô phỏng của tôi cho thấy mức độ bao phủ thực tế 94,5% của khoảng tin cậy 95%.) Ở 1000 thử nghiệm và , độ che phủ thực tế là khoảng 92,7% (tất cả dựa trên 100.000 lần lặp lại.) Vì vậy, đây chỉ là vấn đề với rất thấp , với số lượng dùng thử của bạn. p = 0,01 pp= =0,015p= =0,01p
jbowman

Câu trả lời:


53

Không sử dụng xấp xỉ bình thường

Phần lớn đã được viết về vấn đề này. Một lời khuyên chung là không bao giờ sử dụng xấp xỉ bình thường (nghĩa là khoảng tin cậy tiệm cận / Wald), vì nó có các đặc tính bảo hiểm khủng khiếp. Mã R để minh họa điều này:

library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

Xác suất bảo hiểm cho khoảng tin cậy tiệm cận cho tỷ lệ nhị thức.

Đối với xác suất thành công nhỏ, bạn có thể yêu cầu khoảng tin cậy 95%, nhưng thực tế, có thể nói, khoảng tin cậy 10%!

khuyến nghị

Vậy chúng ta nên sử dụng cái gì? Tôi tin rằng các khuyến nghị hiện tại là những đề xuất được liệt kê trong Dự toán khoảng thời gian cho tỷ lệ nhị phân của Brown, Cai và DasGupta trong Khoa học thống kê 2001, tập. 16, không 2, trang 101 Tiếng133. Các tác giả đã kiểm tra một số phương pháp để tính toán khoảng tin cậy và đưa ra kết luận sau đây.

[W] e đề xuất khoảng Wilson hoặc khoảng trước Jeffreys có đuôi bằng nhau cho n nhỏ và khoảng được đề xuất trong Agresti và Coull cho n lớn hơn .

Khoảng Wilson đôi khi cũng được gọi khoảng điểm , vì nó dựa trên việc đảo ngược bài kiểm tra điểm.

Tính các khoảng

Để tính các khoảng tin cậy này, bạn có thể sử dụng máy tính trực tuyến này hoặc binom.confint()hàm trong binomgói trong R. Ví dụ: với 0 thành công trong 25 thử nghiệm, mã R sẽ là:

> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
  type="central")
         method x  n  mean  lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2         bayes 0 25 0.019  0.000 0.073
3        wilson 0 25 0.000  0.000 0.133

Đây bayeslà khoảng thời gian Jeffreys. (Đối số type="central"là cần thiết để có được khoảng thời gian bằng nhau .)

Lưu ý rằng bạn nên quyết định phương pháp nào trong ba phương pháp bạn muốn sử dụng trước khi tính khoảng thời gian. Nhìn vào cả ba và chọn ngắn nhất sẽ tự nhiên cung cấp cho bạn xác suất bảo hiểm quá nhỏ.

Một câu trả lời nhanh chóng, gần đúng

Như một lưu ý cuối cùng, nếu bạn quan sát chính xác số 0 thành công trong n thử nghiệm của mình và chỉ muốn khoảng tin cậy gần đúng rất nhanh, bạn có thể sử dụng quy tắc ba . Đơn giản chỉ cần chia số 3 cho n . Trong ví dụ trên n là 25, do đó giới hạn trên là 3/25 = 0,12 (giới hạn dưới là tất nhiên 0).


Thx rất nhiều cho câu trả lời của bạn. Hãy tưởng tượng ví dụ thực tế này: Một kiến ​​trúc sư phải thử nghiệm trong một tòa nhà chọc trời nếu tất cả các tấm cách nhiệt trong trần nhà được lắp đặt chính xác. Anh ta mở 25 tấm trần trên một lựa chọn ngẫu nhiên các tầng và tìm thấy trên tất cả các tấm cách nhiệt trần này. Vì vậy, chúng ta có thể kết luận xác suất thực sự của việc có một tấm cách nhiệt là chắc chắn 95% giữa CI [0.867 đến 1] dựa trên khoảng điểm Wilson?
Kasper

2
Tôi sẽ không nói rằng bạn có thể kết luận điều đó với '95% chắc chắn' (Google cho 'giải thích chính xác các khoảng tin cậy'). Ngoài ra, điều này dựa trên giả định của các thử nghiệm độc lập với xác suất thành công tương đương, có thể không thực tế ở đây. Có lẽ các bảng cuối cùng được cài đặt có nguy cơ cài đặt không chính xác cao hơn (người cài đặt chúng đã cảm thấy mệt mỏi / buồn chán). Hoặc có lẽ những người đầu tiên là, vì người đó ít kinh nghiệm hơn. Dù sao, nếu kiến ​​trúc sư được yêu cầu kiểm tra nếu tất cả các bảng được cài đặt chính xác, anh ta nên làm công việc của mình, không chỉ kiểm tra một mẫu!
Karl Ove Hufthammer

5
bayessử dụng đồng phục trước (thay vì của Jeffrey) khi cả hai tham số hình dạng là 1. Tôi đã gửi email cho người bảo trì gói binom vì tò mò về những ưu điểm (của) của Jeffrey so với đồng phục trước đó và anh ta nói với tôi rằng một phiên bản mới sẽ sử dụng đồng phục trước mặc định. Vì vậy, đừng tự hỏi nếu kết quả thay đổi một chút trong tương lai.
cbeleites hỗ trợ Monica

3
Đây là một câu trả lời tuyệt vời. Nó truyền tải tất cả các thông tin chính bạn có thể đọc trong các bài báo về chủ đề này, nhưng rất chính xác và rõ ràng. Nếu tôi có thể upvote hai lần tôi sẽ.
SigmaX

6
Các binconfphương pháp trong Hmisccũng tính toán những khoảng thời gian. Nó mặc định theo phương pháp Wilson.
SigmaX

0

p±zα/2p(1-p)/nπ0π0π0

|p-π0|p(1-p)/n= =0
(1+z02/n)π02+(-2p-z02/n)π0+p2= =0


1
π0

π0pn

Đó là Agresti.
Nick Cox

@NickCox đó là một công việc khác
Jay Schyler Raadt

1
Alan Agresti đã xuất bản các văn bản khác nhau. Tôi đoán bạn đang ám chỉ Giới thiệu về Phân tích dữ liệu phân loại (phiên bản 2 năm 2007; phiên bản thứ 3 dự kiến ​​xuất bản vào tháng 10 năm 2018 và có thể mang ngày tháng năm 2019) từ John Wiley.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.