Khả năng so với xác suất


8

Tôi gặp khó khăn với Khả năng . Tôi hiểu định lý của Bayes

p(A|B,H)=p(B|A,H)p(A|H)p(B|H)

có thể suy ra trực tiếp từ việc áp dụng p(A,B)=p(B)p(A|B)=p(A)p(B|A)=p(B,A) . Vì vậy, theo cách giải thích của tôi, p()các hàm trong Định lý Bayes bằng cách nào đó tất cả các xác suất, có thể là cận biên hoặc có điều kiện. Vì vậy, tôi đã thực sự nghĩ rằng Khả năng như một khái niệm là quan điểm thường xuyên hơn về xác suất nghịch đảo.

Tuy nhiên, bây giờ tôi đã nhiều lần thấy các tuyên bố trong sách của Bayes nói rằng khả năng đó không phải là phân phối xác suất. Đọc cuốn sách của MacKay ngày hôm qua, tôi tình cờ thấy câu nói sau đây

"[...] Điều quan trọng cần lưu ý là các thuật ngữ khả năng và xác suất không phải là từ đồng nghĩa. Đại lượng P(nb|u,N) là khoảng cách của cả nBu . Đối với u , cố định u , N )P(nb|u,N) xác định xác suất trên nB , đối với nB , P(nB|u,N) định xác định độ giống nhau của u . "

  • Tôi hiểu điều này như sau: p(A|B) là xác suất của A theo cho B, do đó probability:A[0,1] . Nhưng xem xét một giá trị nhất định aA và đánh giá p(A=a|B) 's sự phụ thuộc vào nhau bB ' s chúng ta đang thực sự sử dụng một chức năng khác nhau L:B[0,1] .

  • Giải thích này có đúng không?

  • Sau đó, người ta có thể nói rằng các phương pháp khả năng tối đa có thể được thúc đẩy bởi định lý Bayes, trong đó ưu tiên được chọn là không đổi?


1
Là một yếu tố của câu trả lời, tôi khuyên bạn câu trả lời với các liên kết của Stephane Laurent trong mathoverflow.net/questions/10971/ . Hy vọng nó giúp.
peuhp

Câu trả lời:


7

Tôi nghĩ có lẽ cách tốt nhất để giải thích khái niệm khả năng là xem xét một ví dụ cụ thể. Giả sử tôi có một mẫu quan sát IID rút ra từ một phân phối với chưa biết xác suất thành công Bernoulli : X i ~ B e r n o u l l i ( p ) , i = 1 , ... , n , do đó hàm khối xác suất doanh của mẫu là Biểu thức này cũng đặc trưng cho khả năng củapXiBernoulli(p)i=1,,n

Pr[X=xp]=i=1npxi(1p)1xi.
p, được cung cấp một mẫu quan sát : Nhưng nếu chúng ta nghĩ là một biến ngẫu nhiên, thì khả năng này không phải là mật độ: Tuy nhiên, tỷ lệ này là mật độ xác suất, đó là lý do tại sao chúng tôi nói rằng khả năng là một giá trị cụ thể được đưa ra cho mẫu - theo một cách nào đó, tính hợp lý của là một giá trị nào đó cho các quan sát chúng tôi thực hiện.x=(x1,,xn)
L(px)=i=1npxi(1p)1xi.
p
p=01L(px)dp1.
pp

Chẳng hạn, giả sử và mẫu là . Theo trực giác, chúng tôi sẽ kết luận rằng có nhiều khả năng gần với hơn , bởi vì chúng tôi quan sát thấy nhiều hơn. Thật vậy, chúng ta có Nếu chúng ta vẽ đồ thị hàm này trên , chúng ta có thể thấy khả năng xác nhận trực giác của chúng ta như thế nào. Tất nhiên, chúng ta không biết giá trị thực của --it có thể là chứ không phải , nhưng hàm khả năng cho chúng ta biết rằng cái trước ít có khả năng hơn cái sau. Nhưng nếu chúng ta muốn xác định một xác suấtn=5x=(1,1,0,1,1)p10

L(px)=p4(1p).
p[0,1]pp=0.25p=0.8rằng nằm trong một khoảng nhất định, chúng ta phải bình thường hóa khả năng: vì , nó theo sau để có được mật độ sau cho , chúng ta phải nhân với : Trong thực tế, hậu thế này là một bản phân phối beta với các tham số . Bây giờ các khu vực dưới mật độ tương ứng với xác suất.pp=01p4(1p)dp=130p30
fp(px)=30p4(1p).
a=5,b=2

Vì vậy, những gì chúng tôi đã thực hiện ở đây được áp dụng quy tắc của Bayes: Ở đây, là phân phối trước trên (các) tham số , tử số là khả năng đó cũng là sự phân phối chung của

fΘ(θx)=fX(xθ)fΘ(θ)fX(x).
fΘ(θ)θL(θx)=fX(xθ)fΘ(θ)=fX,Θ(x,θ)X,Θ và mẫu số là mật độ biên (vô điều kiện) của , thu được bằng cách tích hợp phân phối chung với để tìm hằng số chuẩn hóa với khả năng mật độ xác suất với liên quan đến (các) tham số. Trong ví dụ bằng số của chúng tôi, chúng tôi mặc nhiên lấy ưu tiên cho để thống nhất trên . Có thể chỉ ra rằng, đối với mẫu Bernoulli, nếu trước đó là , thì hậu thế cho cũng là Beta, nhưng với tham số ,XθfΘ[0,1]Beta(a,b)fΘa=a+xib=b+nxi. Chúng tôi gọi một liên hợp trước đó (và gọi đây là một cặp liên hợp Bernoulli-Beta).
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.