Giải thích đạo hàm Radon-Nikodym giữa các biện pháp xác suất?


11

Ở một số điểm tôi đã thấy việc sử dụng đạo hàm Radon-Nikodym của một thước đo xác suất đối với một thước đo xác suất khác, đáng chú ý nhất là trong phân kỳ Kullback-Leibler, trong đó nó là đạo hàm của phép đo xác suất của một mô hình cho một tham số tùy ý đối với tham số thực :θ 0θθ0

dPθdPθ0

Trong đó cả hai đều là các số đo xác suất trên không gian của các điểm dữ liệu có điều kiện trên một giá trị tham số: .Pθ(D)=P(D|θ)

Giải thích về một dẫn xuất Radon-Nikodym như vậy trong phân kỳ Kullback-Leibler, hay nói chung hơn là giữa hai biện pháp xác suất?

Câu trả lời:


12

Đầu tiên, chúng ta không cần các biện pháp xác suất, chỉ cần -finitness. Vì vậy, hãy là một không gian đo lường được và để cho và được -finite biện pháp trên .M = ( Ω , F ) L v σ MσM=(Ω,F)μνσM

Các Radon-Nikodym lý khẳng định rằng nếu cho tất cả , ký hiệu bằng , sau đó có tồn tại một Borel không âm hàm như vậy cho tất cả .Một F μ » ν e ν ( A ) = Một fμ(A)=0ν(A)=0AFμνfA F

ν(A)=Afdμ
AF

Đây là cách tôi muốn nghĩ về điều này. Đầu tiên, đối với hai biện pháp bất kỳ trên , hãy xác định có nghĩa là . Đây là một mối quan hệ tương đương hợp lệ và chúng ta nói rằng và là tương đương trong trường hợp này. Tại sao điều này là một sự tương đương hợp lý cho các biện pháp? Các biện pháp chỉ là chức năng nhưng tên miền của chúng là khó khăn để hình dung. Thế còn nếu hai hàm thông thường có thuộc tính này, tức là ? Chà, xác định và lưu ý rằng bất cứ nơi nào trên sự hỗ trợ của μ ~ v μ ( A ) = 0Mμνμ ν f , g : RR f ( x ) = 0μ(A)=0ν(A)=0μνf,g:RRh ( x ) = { f ( x ) / g ( x ) g ( x ) 0 π e o.w.f(x)=0g(x)=0

h(x)={f(x)/g(x)g(x)0πeo.w.
g h = f g g h = 0 π e = 0 = f f g h g f 0 / 0 g = 0 h π eg chúng tôi có và ngoài sự hỗ trợ của (vì và chia sẻ hỗ trợ) nên cho phép chúng tôi chuyển đổi thành . Như @whuber chỉ ra, ý tưởng chính ở đây không phải là bằng cách nào đó "an toàn" để làm hoặc bỏ qua, mà là khi thì không quan trọng là làm gì nên chúng ta có thể định nghĩa nó một cách tùy ý (như trở thành không có ý nghĩa đặc biệt ở đây) và mọi thứ vẫn hoạt động. Ngoài ra trong trường hợp này chúng ta có thể định nghĩa hàm tương tự với sao chogh=fg gh=0πe=0=ffghgf0/0g=0hπe g / f f h = ghg/ffh=g .

Tiếp theo giả sử , nhưng hướng khác không nhất thiết phải giữ. Điều này có nghĩa là định nghĩa trước đây của chúng tôi về vẫn hoạt động, nhưng bây giờ không hoạt động vì nó sẽ có phân chia thực tế bằng . Do đó, chúng ta có thể chuyển đổi thành thông qua , nhưng chúng ta không thể đi theo hướng khác bởi vì chúng ta cần phải chuyển một số thành một số khác không.h h 0 g f g h = f 0g(x)=0f(x)=0hh0gfgh=f0

Bây giờ, hãy trở lại và và biểu thị RND của chúng tôi bằng . Nếu , thì điều này theo trực giác có nghĩa là người ta có thể thay đổi kích thước thành người khác và ngược lại. Nhưng nhìn chung, chúng tôi chỉ muốn đi theo một hướng với điều này (nghĩa là hủy bỏ một biện pháp tốt đẹp như biện pháp Lebesgue thành một biện pháp trừu tượng hơn) vì vậy chúng tôi chỉ cần để làm những việc hữu ích. Sự thay đổi kích thước này là trái tim của RND.ν e μ ~ ν μ » νμνfμνμν

0/00Aμ(A)=010/00/00μ vì vậy chúng tôi chỉ có thể định nghĩa RND của mình là một cái gì đó tốt đẹp ở đó mà không ảnh hưởng đến bất cứ điều gì.

kμ=νk>0

ν(A)=Adν=Akdμ
f(x)=k=dνdμ

0f(x)=φ(x)+1Q(x)1X

P(XA)=A(φ+1Q)dλ
=Aφdλ+λ(Q)=Aφdλ
XXQ0λ

XPois(η)YBin(n,p)PXPYccc(A)=0A=

dPYdPX=dPY/dcdPX/dc=fYfX

PY(A)=AdPY
=AdPYdPXdPX=AdPYdPXdPXdcdc
=yAdPYdPX(y)dPXdc(y)=yAfY(y)fX(y)fX(y)=yAfY(y).

P(X=n)>0nY


PQμdPdQ=dP/dμdQ/dμ:=p/q


3
0/00/0

1
@whuber cảm ơn rất nhiều vì bình luận, điều đó thực sự có ích. Tôi đã cố gắng để cập nhật đến địa chỉ đó
JLD
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.