Tôi nghĩ có lẽ cách tốt nhất để giải thích khái niệm khả năng là xem xét một ví dụ cụ thể. Giả sử tôi có một mẫu quan sát IID rút ra từ một phân phối với chưa biết xác suất thành công Bernoulli : X i ~ B e r n o u l l i ( p ) , i = 1 , ... , n , do đó hàm khối xác suất doanh của mẫu là Biểu thức này cũng đặc trưng cho khả năng củapXi∼Bernoulli(p)i=1,…,n
Pr[X=x∣p]=∏i=1npxi(1−p)1−xi.
p, được cung cấp một mẫu quan sát : Nhưng nếu chúng ta nghĩ là một biến ngẫu nhiên, thì khả năng này không phải là mật độ: Tuy nhiên,
tỷ lệ này là mật độ xác suất, đó là lý do tại sao chúng tôi nói rằng khả năng là một giá trị cụ thể được đưa ra cho mẫu - theo một cách nào đó, tính hợp lý của là một giá trị nào đó cho các quan sát chúng tôi thực hiện.
x=(x1,…,xn)L(p∣x)=∏i=1npxi(1−p)1−xi.
p∫1p=0L(p∣x)dp≠1.
pp
Chẳng hạn, giả sử và mẫu là . Theo trực giác, chúng tôi sẽ kết luận rằng có nhiều khả năng gần với hơn , bởi vì chúng tôi quan sát thấy nhiều hơn. Thật vậy, chúng ta có Nếu chúng ta vẽ đồ thị hàm này trên , chúng ta có thể thấy khả năng xác nhận trực giác của chúng ta như thế nào. Tất nhiên, chúng ta không biết giá trị thực của --it có thể là chứ không phải , nhưng hàm khả năng cho chúng ta biết rằng cái trước ít có khả năng hơn cái sau. Nhưng nếu chúng ta muốn xác định một xác suấtn=5x=(1,1,0,1,1)p10
L(p∣x)=p4(1−p).
p∈[0,1]pp=0.25p=0.8rằng nằm trong một khoảng nhất định, chúng ta phải bình thường hóa khả năng: vì , nó theo sau để có được
mật độ sau cho , chúng ta phải nhân với : Trong thực tế, hậu thế này là một bản phân phối beta với các tham số . Bây giờ các khu vực dưới mật độ tương ứng với xác suất.
p∫1p=0p4(1−p)dp=130p30fp(p∣x)=30p4(1−p).
a=5,b=2
Vì vậy, những gì chúng tôi đã thực hiện ở đây được áp dụng quy tắc của Bayes: Ở đây, là phân phối trước trên (các) tham số , tử số là khả năng đó cũng là sự phân phối chung của
fΘ(θ∣x)=fX(x∣θ)fΘ(θ)fX(x).
fΘ(θ)θL(θ∣x)=fX(x∣θ)fΘ(θ)=fX,Θ(x,θ)X,Θ và mẫu số là mật độ biên (vô điều kiện) của , thu được bằng cách tích hợp phân phối chung với để tìm hằng số chuẩn hóa với khả năng mật độ xác suất với liên quan đến (các) tham số. Trong ví dụ bằng số của chúng tôi, chúng tôi mặc nhiên lấy ưu tiên cho để thống nhất trên . Có thể chỉ ra rằng, đối với mẫu Bernoulli, nếu trước đó là , thì hậu thế cho cũng là Beta, nhưng với tham số ,
XθfΘ[0,1]Beta(a,b)fΘa∗=a+∑xib∗=b+n−∑xi. Chúng tôi gọi một
liên hợp trước đó (và gọi đây là một cặp liên hợp Bernoulli-Beta).