Kỹ thuật tốt nhất để tính khoảng tin cậy của thí nghiệm nhị thức là gì, nếu ước tính của bạn là (hoặc tương tự ) và cỡ mẫu tương đối nhỏ, ví dụ ?p = 1 n = 25
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Kỹ thuật tốt nhất để tính khoảng tin cậy của thí nghiệm nhị thức là gì, nếu ước tính của bạn là (hoặc tương tự ) và cỡ mẫu tương đối nhỏ, ví dụ ?p = 1 n = 25
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Câu trả lời:
Phần lớn đã được viết về vấn đề này. Một lời khuyên chung là không bao giờ sử dụng xấp xỉ bình thường (nghĩa là khoảng tin cậy tiệm cận / Wald), vì nó có các đặc tính bảo hiểm khủng khiếp. Mã R để minh họa điều này:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
Đối với xác suất thành công nhỏ, bạn có thể yêu cầu khoảng tin cậy 95%, nhưng thực tế, có thể nói, khoảng tin cậy 10%!
Vậy chúng ta nên sử dụng cái gì? Tôi tin rằng các khuyến nghị hiện tại là những đề xuất được liệt kê trong Dự toán khoảng thời gian cho tỷ lệ nhị phân của Brown, Cai và DasGupta trong Khoa học thống kê 2001, tập. 16, không 2, trang 101 Tiếng133. Các tác giả đã kiểm tra một số phương pháp để tính toán khoảng tin cậy và đưa ra kết luận sau đây.
[W] e đề xuất khoảng Wilson hoặc khoảng trước Jeffreys có đuôi bằng nhau cho n nhỏ và khoảng được đề xuất trong Agresti và Coull cho n lớn hơn .
Khoảng Wilson đôi khi cũng được gọi là khoảng điểm , vì nó dựa trên việc đảo ngược bài kiểm tra điểm.
Để tính các khoảng tin cậy này, bạn có thể sử dụng máy tính trực tuyến này hoặc binom.confint()
hàm trong binom
gói trong R. Ví dụ: với 0 thành công trong 25 thử nghiệm, mã R sẽ là:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Đây bayes
là khoảng thời gian Jeffreys. (Đối số type="central"
là cần thiết để có được khoảng thời gian bằng nhau .)
Lưu ý rằng bạn nên quyết định phương pháp nào trong ba phương pháp bạn muốn sử dụng trước khi tính khoảng thời gian. Nhìn vào cả ba và chọn ngắn nhất sẽ tự nhiên cung cấp cho bạn xác suất bảo hiểm quá nhỏ.
Như một lưu ý cuối cùng, nếu bạn quan sát chính xác số 0 thành công trong n thử nghiệm của mình và chỉ muốn khoảng tin cậy gần đúng rất nhanh, bạn có thể sử dụng quy tắc ba . Đơn giản chỉ cần chia số 3 cho n . Trong ví dụ trên n là 25, do đó giới hạn trên là 3/25 = 0,12 (giới hạn dưới là tất nhiên 0).
bayes
sử dụng đồng phục trước (thay vì của Jeffrey) khi cả hai tham số hình dạng là 1. Tôi đã gửi email cho người bảo trì gói binom vì tò mò về những ưu điểm (của) của Jeffrey so với đồng phục trước đó và anh ta nói với tôi rằng một phiên bản mới sẽ sử dụng đồng phục trước mặc định. Vì vậy, đừng tự hỏi nếu kết quả thay đổi một chút trong tương lai.
binconf
phương pháp trong Hmisc
cũng tính toán những khoảng thời gian. Nó mặc định theo phương pháp Wilson.