Có thể áp dụng phân kỳ KL giữa phân phối rời rạc và liên tục?


12

Tôi không phải là nhà toán học. Tôi đã tìm kiếm trên internet về KL Divergence. Những gì tôi học được là phân kỳ KL đo lường thông tin bị mất khi chúng ta phân phối gần đúng một mô hình liên quan đến phân phối đầu vào. Tôi đã thấy những điều này giữa bất kỳ hai phân phối liên tục hoặc rời rạc. Chúng ta có thể làm điều đó giữa liên tục và rời rạc hoặc ngược lại?


Câu trả lời:


3

Không: Phân kỳ KL chỉ được xác định trên các bản phân phối trên một không gian chung. Nó hỏi về mật độ xác suất của một điểm dưới hai phân phối khác nhau, và . Nếu là phân phối trên và phân phối trên , thì không có ý nghĩa đối với các điểm và không có ý nghĩa đối với các điểm . Trên thực tế, chúng ta thậm chí không thể làm điều đó cho hai phân phối liên tục trên các không gian có chiều khác nhau (hoặc riêng biệt hoặc bất kỳ trường hợp nào có không gian xác suất cơ bản không khớp).p ( x ) q ( x ) p R 3 q Z q ( x ) p R 3 p ( z ) z Zxp(x)q(x)pR3qZq(x)pR3p(z)zZ

Nếu bạn có một trường hợp cụ thể trong tâm trí, có thể có thể đưa ra một số biện pháp tương tự có sự khác biệt giữa các bản phân phối. Ví dụ, có thể có ý nghĩa để mã hóa phân phối liên tục theo mã cho một mã riêng biệt (rõ ràng là có thông tin bị mất), ví dụ bằng cách làm tròn đến điểm gần nhất trong trường hợp rời rạc.


Lưu ý rằng sự phân kỳ KL giữa các phân phối rời rạc và hoàn toàn liên tục được xác định rõ.
Olivier

@Olivier Định nghĩa thông thường đòi hỏi một biện pháp thống trị chung, không?
Dougal

1
Bạn đúng khi P và Q được xác định trên các không gian khác nhau. Nhưng trên một không gian có thể đo lường chung, một biện pháp như vậy luôn tồn tại (lấy P + Q chẳng hạn) và phân kỳ KL không phụ thuộc vào sự lựa chọn cụ thể của biện pháp thống trị.
Olivier

8

Có, sự phân kỳ KL giữa các biến ngẫu nhiên liên tục và rời rạc được xác định rõ. Nếu Q là các bản phân phối trên một số không gian X , sau đó cả hai PQ có mật độ f , g đối với μ = P + QD K L ( P , Q ) = X f log fPQXPQfgμ=P+Q

DKL(P,Q)=Xflogfgdμ.

X=[0,1]PQ=δ00f(x)=11x=0g(x)=1x=0

DKL(P,Q)=.

Xflogfgdμ

Thay đổi định lý đo.
Olivier

1

Không nói chung. Phân kỳ KL là

DKL(P || Q)=Xlog(dPdQ)dP

PQPQσdPdQ

σ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.