Tại sao chúng ta sử dụng phân kỳ Kullback-Leibler chứ không phải entropy chéo trong hàm mục tiêu t-SNE?


39

Trong tâm trí của tôi, phân kỳ KL từ phân phối mẫu sang phân phối thực sự chỉ đơn giản là sự khác biệt giữa entropy chéo và entropy chéo.

Tại sao chúng ta sử dụng entropy chéo là hàm chi phí trong nhiều mô hình học máy, nhưng sử dụng phân kỳ Kullback-Leibler trong t-sne? Có sự khác biệt về tốc độ học tập?


1
Xem ở đây để biết một số trực giác về KL: stats.stackexchange.com/questions/188903/ Đổi
kjetil b halvorsen

Câu trả lời:


81

Phân kỳ KL là một cách tự nhiên để đo lường sự khác biệt giữa hai phân phối xác suất. Entropy của phân phối p cung cấp số bit tối thiểu có thể có cho mỗi thông báo sẽ cần (trung bình) để mã hóa các sự kiện được rút ra từ p . Để đạt được ràng buộc này sẽ yêu cầu sử dụng một mã tối ưu được thiết kế cho p , để gán các từ mã ngắn hơn cho các sự kiện xác suất cao hơn. D K L ( p q ) có thể được hiểu là số lượng dự kiến của phụ bit cho mỗi tin nhắn cần thiết để sự kiện mã hóa rút ra từ đúng phân phối pH(p)pppDKL(pq)p, nếu sử dụng mã tối ưu để phân phối chứ không phải p . Nó có một số thuộc tính tốt để so sánh phân phối. Ví dụ: nếu pq bằng nhau thì phân kỳ KL là 0.qppq

H(p,q)pqDKL(pq)H(p,q)pH(p,q)qppH(p,q)p

Phân kỳ KL và entropy chéo có liên quan như:

DKL(pq)=H(p,q)H(p)

pqp

pq

pH(p)pH(p)p

pqDKL(pq)pqjipji là phân kỳ Kullback-Leibler (trong trường hợp này bằng với entropy chéo cho đến hằng số phụ gia). "

van der Maaten và Hinton (2008) . Trực quan hóa dữ liệu bằng t-SNE.


Tôi có thể bằng cách nào đó 'yêu thích' câu trả lời? Tôi muốn lưu cái này vì nó là một lời giải thích rất hay
zwep

1
Cảm ơn, rất vui vì nó hữu ích cho bạn. Bạn có thể đánh dấu một câu hỏi là mục ưa thích để lưu toàn bộ chủ đề, bằng cách nhấp vào biểu tượng ngôi sao bên dưới các nút biểu quyết. Bạn có thể xem danh sách yêu thích của bạn trên trang tài khoản của bạn.
user20160
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.