Phân kỳ KL giữa hai Gaussian đa biến


46

Tôi gặp khó khăn khi lấy công thức phân kỳ KL giả sử hai phân phối bình thường đa biến. Tôi đã thực hiện trường hợp đơn biến khá dễ dàng. Tuy nhiên, đã khá lâu kể từ khi tôi lấy chỉ số toán học, vì vậy tôi gặp một số khó khăn khi mở rộng nó sang trường hợp đa biến. Tôi chắc chắn tôi chỉ thiếu một cái gì đó đơn giản.

Đây là những gì tôi có ...

Giả sử cả và là các file PDF của phân phối chuẩn với phương tiện và và chênh lệch và , tương ứng. Khoảng cách Kullback-Leibler từ đến là:pqμ1μ2Σ1Σ2qp

[log(p(x))log(q(x))] p(x) dx , đối với hai quy tắc đa biến là:

12[log|Σ2||Σ1|d+Tr(Σ21Σ1)+(μ2μ1)TΣ21(μ2μ1)]

Theo logic tương tự như bằng chứng này , tôi đi đến đây trước khi tôi gặp khó khăn:

=[d2log|Σ2||Σ1|+12((xμ2)TΣ21(xμ2)(xμ1)TΣ21(xμ1))]×p(x)dx

=E[d2log|Σ2||Σ1|+12((xμ2)TΣ21(xμ2)(xμ1)TΣ21(xμ1))]

Tôi nghĩ rằng tôi phải thực hiện thủ thuật theo dõi , nhưng tôi không chắc phải làm gì sau đó. Bất kỳ gợi ý hữu ích nào để đưa tôi trở lại đúng đường sẽ được đánh giá cao!


1
stanford.edu/~jduchi/projects/general_notes.pdf . Phần cuối cùng cũng đưa ra đạo hàm.
dùng3540823

Câu trả lời:


47

Bắt đầu với nơi bạn bắt đầu với một số sửa chữa nhỏ, chúng tôi có thể viết

KL=[12log|Σ2||Σ1|12(xμ1)TΣ11(xμ1)+12(xμ2)TΣ21(xμ2)]×p(x)dx=12log|Σ2||Σ1|12tr {E[(xμ1)(xμ1)T] Σ11}+12E[(xμ2)TΣ21(xμ2)]=12log|Σ2||Σ1|12tr {Id}+12(μ1μ2)TΣ21(μ1μ2)+12tr{Σ21Σ1}=12[log|Σ2||Σ1|d+tr{Σ21Σ1}+(μ2μ1)TΣ21(μ2μ1)].

Lưu ý rằng tôi đã sử dụng một vài thuộc tính từ Phần 8.2 của Sách dạy nấu ăn ma trận .


Tôi thấy bạn lấy ra D mà tôi đã có ban đầu. Bạn sẽ không có thuật ngữ D sau khi lấy nhật ký của Gaussian trong vài bước đầu tiên chứ?
dmartin

Hãy xem xét hệ số tỷ lệ , của mật độ thông thường đa biến. Khi tính toán chênh lệch log, thuật ngữ sẽ biến mất. Không có thuật ngữ cho các yếu tố quyết định - chỉ đơn giản là , được xác định . (2π)d/2|Σk|1/2k=1,2(2π)d/2d1/2
ramhiser

Không có vấn đề gì cả. Mừng vì tôi có thể giúp.
ramhiser

Xin chào, làm thế nào bạn đến với bước cuối cùng? Bạn đã thay đổi dấu hiệu của thành như thế nào? μ1μ2μ2μ1
axitghost

1
@acidghost Hoặc là một trong hai hoạt động bởi vì chúng ta có thể yếu tố tiêu cực từ cả hai bên. Nhân hai số âm mang lại một số dương.
ramhiser
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.