Có một số vấn đề với cách tiếp cận của bạn. Đầu tiên, bạn muốn sử dụng khoảng tin cậy cho những thứ mà chúng không được thiết kế cho. Nếu thay đổi, thì khoảng tin cậy sẽ không cho bạn thấy nó thay đổi như thế nào. Kiểm tra Tại sao Khoảng tin cậy (CI) 95% không ngụ ý 95% cơ hội chứa giá trị trung bình? để tìm hiểu thêm về khoảng tin cậy. Hơn nữa, sử dụng xấp xỉ bình thường cho tỷ lệ nhị thức và khoảng tin cậy của nó không phải là một ý tưởng hay, như được mô tả bởi Brown et al (2001) .p
Trong thực tế, từ mô tả của bạn, có vẻ như bạn muốn ước tính khoảng tin cậy Bayes , tức là khoảng sẽ chứa một phần phân phối nhất định của . Vâng, tôi đã nói Bayes , vì trên thực tế bạn đã xác định vấn đề của mình là mô hình Bayes. Bạn nói rằng bạn giả sử rằng là một biến ngẫu nhiên, trong khi trong cài đặt thường xuyên, sẽ là một tham số cố định. Nếu bạn đã giả định nó, tại sao không sử dụng mô hình Bayes cho dữ liệu của bạn? Bạn sẽ sử dụng mô hình nhị phân beta (xem thêm Giới thiệu về mô hình Beta-Binomialpppgiấy của Dan Navarro và Amy Perfors). Trong trường hợp như thế này, cực kỳ dễ dàng để ước tính mô hình như vậy. Chúng ta có thể định nghĩa nó như sau:
X∼Binomial(N,p)p∼Beta(α,β)
vì vậy, dữ liệu của bạn tuân theo phân phối nhị thức được tham số hóa bởi và , trong đó là một biến ngẫu nhiên. Chúng tôi giả sử phân phối beta với tham số và là ưu tiên hàng đầu cho . Tôi đoán rằng nếu bạn muốn sử dụng phương pháp thường xuyên, bạn không có bất kỳ kiến thức nào trước về phân phối có thể , vì vậy bạn sẽ chọn tham số trước "không chính xác" bởi hoặc (nếu bạn thích, bạn có thể dịch các tham số đó sangXNppαβppα=β=1α=β=0.5trung bình và độ chính xác , hoặc trung bình và phương sai ). Sau khi cập nhật của bạn trước , sau phân phối đơn giản chỉ là một bản phân phối beta parametrized bởip
α′=α+total number of successesβ′=β+total number of failures
với ý nghĩa
E(X)=Nα′α′+β′
Để đọc thêm về cách tính số lượng khác của phân phối này, hãy kiểm tra bài viết Wikipedia về phân phối nhị thức beta . Bạn có thể tính các khoảng tin cậy bằng số bằng cách (a) đảo ngược số lượng hàm phân phối tích lũy của phân phối nhị phân beta hoặc bằng cách (b) lấy mẫu số lượng lớn các giá trị ngẫu nhiên từ phân phối nhị phân beta và sau đó tính toán các lượng tử mẫu từ nó. Cách tiếp cận thứ hai khá dễ dàng vì bạn chỉ cần lặp lại tuần tự quy trình sau:
- rút từ phân phối beta được tham số hóa bởi và ,pα′β′
- vẽ từ phân phối nhị thức parametrized bởi và .xpN
cho đến khi bạn vẽ mẫu đủ lớn để thấy nó tự tin để tính toán số lượng quan tâm.
Tất nhiên nếu bạn biết giá trị trung bình và độ lệch chuẩn của và bạn khăng khăng sử dụng phân phối bình thường cho nó, bạn cũng có thể sử dụng mô phỏng, nhưng với việc sử dụng phân phối bình thường để mô phỏng các giá trị của . Dưới đây tôi cung cấp ví dụ mã trong R cho mô phỏng như vậy.pp
R <- 1e5 # number of samples to draw in simulation
N <- 500 # known N
mu <- 0.3 # known mean of p
sigma <- 0.07 # known standard deviation of p
p <- rnorm(R, mu, sigma) # simulate p
x <- rbinom(R, N, p) # simulate X
mean(x) # estimate for mean of X
quantile(p*N, c(0.025, 0.975)) # 95% interval estimate for variability of E(X)
Hoặc bạn chỉ có thể lấy quantiles thích hợp sử dụng nghịch đảo của hàm phân phối tích lũy bình thường và nhân chúng bằng . Tuy nhiên, hãy nhớ rằng đây không phải là khoảng tin cậy, mà là khoảng tin cậy.N
Brown, LD, Cai, TT, & DasGupta, A. (2001). Ước lượng khoảng cho một tỷ lệ nhị thức. Khoa học thống kê, 101-117.