Giá trị tối đa của phân kỳ Kullback-Leibler (KL) là bao nhiêu


14

Tôi sẽ sử dụng phân kỳ KL trong mã python của tôi và tôi đã nhận được hướng dẫn này .

Trong hướng dẫn đó, để thực hiện phân kỳ KL khá đơn giản.

kl = (model * np.log(model/actual)).sum()

Theo tôi hiểu, phân phối xác suất của modelactualnên <= 1.

Câu hỏi của tôi là, giá trị ràng buộc tối đa / tối đa có thể có của k là gì ?. Tôi cần biết giá trị tối đa có thể của khoảng cách kl như đối với giới hạn tối đa trong mã của tôi.


Câu trả lời:


16

Hoặc thậm chí với cùng một sự hỗ trợ, khi một phân phối có đuôi béo hơn nhiều so với phân phối khác. Lấy khi p ( x ) = Cauchy mật độ 1

KL(P||Q)=p(x)log(p(x)q(x))dx
sau đó KL(P||Q)=1
p(x)=1π11+x2Cauchy densityq(x)=12πexp{x2/2}Normal density
1
KL(P||Q)=1π11+x2logp(x)dx+1π11+x2[log(2π)/2+x2/2]dx
Tồn tại các khoảng cách khác vẫn còn giới hạn như
1π11+x2x2/2dx=+
  • các khoảng cách, tương đương với tổng số khoảng cách dao động,L¹
  • khoảng cách Wasserstein
  • khoảng cách Hellinger

1
Nhận xét rất tốt @ Xi'an
Carlos Campos

Cảm ơn @ Xi'an có nghĩa là, thậm chí tổng của tất cả các thùng cho cả hai phân phối là = 1, phân kỳ kl không có giới hạn tối đa? Bạn có bất kỳ chức năng khoảng cách tùy chọn nào khác cho hai phân phối xác suất đã xác định ràng buộc tối đa / ràng buộc tĩnh không?
dùng46543

P có hoàn toàn liên tục đối với Q trong trường hợp này không?
Sangwoong Yoon

Trong trường hợp"? KL không được định nghĩa như vậy đối với các bản phân phối không hoàn toàn liên tục tạo ra nhau mà tôi tin.
Tây An

12

Đối với các bản phân phối không có cùng hỗ trợ, phân kỳ KL không bị giới hạn. Nhìn vào định nghĩa:

KL(P||Q)=p(x)ln(p(x)q(x))dx

nếu P và Q có không phải là hỗ trợ giống nhau, có tồn tại một số điểm nơi p ( x ' ) 0q ( x ' ) = 0xp(x)0q(x)=0 , làm cho KL đi đến vô cùng. Điều này cũng có thể áp dụng cho các bản phân phối riêng biệt, đó là trường hợp của bạn.

Chỉnh sửa: Có thể một lựa chọn tốt hơn để đo độ phân kỳ giữa các phân phối xác suất sẽ được gọi là khoảng cách Wasserstein là một số liệu và có các thuộc tính tốt hơn so với phân kỳ KL. Nó đã trở nên khá phổ biến do các ứng dụng của nó trong học tập sâu (xem mạng WGAN)


Cảm ơn @ carlos-campos phân phối của tôi cả thực tế và mô hình đều có cùng một điều kiện là tổng của tất cả các thùng = 1. Điều đó có nghĩa là phân kỳ Kl của tôi vẫn không có giới hạn tối đa? Tôi sẽ xem xét khoảng cách
wassertein

Wasserstein hoặc khoảng cách động đất có giới hạn tối đa rõ ràng không? bởi vì tôi cần nó.
dùng46543

@ user46543 Khoảng cách của Wasserstein có thể cao bằng
Mark L. Stone

Xin chào @ MarkL.Stone vì vậy không có hàm khoảng cách để tính khoảng cách giữa hai phân phối xác suất có giới hạn tối đa tĩnh? ví dụ: trong khi hai phân phối xác suất có tổng bằng 1 và giới hạn tối đa của khoảng cách sẽ là 1. Tôi có đúng không?
dùng46543

3

Để thêm vào câu trả lời xuất sắc của CarlosXi'an , một điều thú vị cần lưu ý là một điều kiện đủ để phân kỳ KL là hữu hạn là cho cả hai biến ngẫu nhiên có cùng hỗ trợ nhỏ gọn và mật độ tham chiếu bị giới hạn . Kết quả này cũng thiết lập một giới hạn ngầm định cho mức tối đa của phân kỳ KL (xem định lý và bằng chứng bên dưới).


Định lý: Nếu mật độ q có cùng hỗ trợ X nhỏ gọn và mật độ p được giới hạn trên hỗ trợ đó (nghĩa là có giới hạn trên hữu hạn) thì K L ( P | | Q ) < .pqXpKL(P||Q)<

Chứng minh: có hỗ trợ nhỏ gọn X, điều này có nghĩa là có một số giá trị cực kỳ dương:qX

q_infxXq(x)>0.

Tương tự, vì có hỗ trợ nhỏ gọn X, điều này có nghĩa là có một số giá trị tối cao dương:pX

p¯supxXp(x)>0.

Hơn nữa, vì đây là những cả mật độ vào sự hỗ trợ tương tự, và sau này được bao bọc, chúng ta có . Điều này có nghĩa rằng:0<q_p¯<

supxXln(p(x)q(x))ln(p¯)ln(q_).

Bây giờ, cho phép là sau trên ràng buộc, chúng tôi rõ ràng có 0 L _ < sao cho:L_ln(p¯)ln(q_)0L_<

KL(P||Q)=Xln(p(x)q(x))p(x)dxsupxXln(p(x)q(x))Xp(x)dx(ln(p¯)ln(q_))Xp(x)dx=L_<.

Điều này thiết lập giới hạn trên yêu cầu, chứng minh định lý.


Kết quả là chính xác nhưng nặng hạn chế: a Beta mật độ không được hưởng một sự hỗ trợ nhỏ gọn khi max ( α , β ) > 1 . B(α,β)max(α,β)>1
Tây An

Điều đó đúng: sau tất cả chỉ là một điều kiện đủ. Điều kiện đủ yếu được chào đón!
Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.