Hãy xem xét tình huống trong đó bạn có quan sát về quá trình nhị phân (2-coutcome). Thông thường, hai kết quả có thể có trên mỗi thử nghiệm được gọi là Thành công và Thất bại.n=20
Khoảng tin cậy thường xuyên. Giả sử bạn quan sát thành công trong thử nghiệm. Xem số của Thành công dưới dạng một biến ngẫu nhiên trong đó xác suất thành công là một hằng số chưa biết. Khoảng tin cậy thường xuyên Wald 95% dựa trên ước tính của
Sử dụng xấp xỉ bình thường, CI này có dạngx=15n=20XX∼Binom(n=20;p),pp^=15/20=0.75,p.p^±1.96p^(1−p^)/n−−−−−−−−−√ hoặc là
(0.560,0.940).[
Phong cách 95% Agresti-Coull được cải thiện đôi chút là(0.526,0.890).]
Một cách giải thích phổ biến là quy trình tạo ra một khoảng như vậy sẽ tạo ra giới hạn tin cậy thấp hơn và cao hơn bao gồm giá trị thực của ptrong 95% trường hợp trong thời gian dài. [Ưu điểm của khoảng Agresti-Coull là tỷ lệ dài hạn của các vùi như vậy gần tới 95% so với khoảng Wald.]
Bayesian khoảng tin cậy. Cách tiếp cận Bayes bắt đầu bằng cách điều trịpnhư một biến ngẫu nhiên. Trước khi xem dữ liệu, nếu chúng tôi không có kinh nghiệm trước với thử nghiệm nhị thức loại đang được tiến hành hoặc không có ý kiến cá nhân về việc phân phốip, chúng tôi có thể chọn phân phối đồng phục 'phẳng' hoặc 'không phù hợp', cho biết p∼Unif(0,1)≡Beta(1,1).
Sau đó, đưa ra 15 thành công trong 20 thử nghiệm nhị thức, chúng tôi tìm thấy phân phối sau của p là sản phẩm của phân phối trước và hàm khả năng nhị thức.
f(p|x)∝p1−1(1−p)1−1×p15(1−p)5∝p16−1(1−p)6−1,
nơi biểu tượng ∝ (đọc 'tỷ lệ thuận với') chỉ ra rằng chúng tôi đang bỏ qua các yếu tố không đổi 'định mức' của các bản phân phối, không chứa p.
Không có hệ số định mức, hàm mật độ hoặc PMF được gọi là 'hạt nhân' của phân phối.
Ở đây chúng tôi nhận ra rằng hạt nhân của phân phối sau là phân phối Beta(16,6).Sau đó, một khoảng sau 95% Bayesian hoặc khoảng tin cậy được tìm thấy bằng cách cắt 2,5% từ mỗi đuôi của phân phối sau. Đây là kết quả từ R:
(0.528,0.887).[Để biết thông tin về các bản phân phối beta, xem Wikipedia .]
qbeta(c(.025,.975), 16, 6)
[1] 0.5283402 0.8871906
Nếu chúng tôi tin rằng trước đó là hợp lý và tin rằng thử nghiệm nhị thức 20 thử nghiệm đã được tiến hành một cách công bằng, thì về mặt logic, chúng tôi phải mong đợi ước tính khoảng thời gian Bayes cung cấp thông tin hữu ích về thử nghiệm trong tay --- không liên quan đến giả thuyết dài- chạy trong tương lai.
Lưu ý rằng khoảng tin cậy Bayes này tương tự về mặt số với khoảng tin cậy Agresti-Coull. Tuy nhiên, như bạn chỉ ra, các diễn giải của hai loại ước tính khoảng (thường xuyên và Bayes) không giống nhau.
Thông tin trước. Trước khi chúng tôi xem dữ liệu, nếu chúng tôi có lý do để tin rằngp≈2/3, sau đó chúng tôi có thể đã chọn phân phối Beta(8,4)như phân phối trước. [Phân phối này có nghĩa là 2/3, độ lệch chuẩn khoảng 0,35 và đặt khoảng 95% xác suất của nó trong khoảng(0.39,0.89).]
qbeta(c(.025,.975), 8,4)
[1] 0.3902574 0.8907366
Trong trường hợp đó, nhân số trước với khả năng cho hạt nhân sau Beta(23,7),
sao cho khoảng tin cậy 95% Bayes là
(0.603,0.897). Phân phối sau là một sự pha trộn thông tin trong phần trước và khả năng, đó là một thỏa thuận thô, do đó, ước tính khoảng thời gian Bayes ngắn hơn so với khoảng từ căn hộ trước.
qbeta(c(.025,.975), 23,7)
[1] 0.6027531 0.8970164
Lưu ý: (1) Hàm khả năng nhị phân trước và nhị thức là 'liên hợp', nghĩa là tương thích về mặt toán học theo cách cho phép chúng ta tìm phân phối sau mà không cần tính toán. Đôi khi, dường như không có phân phối trước mà liên hợp với khả năng. Sau đó, có thể cần phải sử dụng tích hợp số để tìm phân phối sau.
(2) Một khoảng đáng tin cậy Bayes từ một trước không chính xác phụ thuộc vào chức năng khả năng. Ngoài ra, phần lớn suy luận thường xuyên phụ thuộc vào chức năng khả năng. Do đó, không có gì ngạc nhiên khi một khoảng tin cậy Bayes từ căn hộ trước có thể giống nhau về mặt số lượng với khoảng tin cậy thường xuyên dựa trên cùng khả năng.