KL có một ý nghĩa sâu sắc khi bạn hình dung một tập hợp các nha khoa như một đa tạp trong thang đo ngư nghiệp, nó cho khoảng cách đo đạc giữa hai phân phối "gần". Chính thức:
ds2=2KL(p(x,θ),p(x,θ+dθ))
Các dòng sau đây ở đây để giải thích với các chi tiết về ý nghĩa của công thức toán học las này.
Định nghĩa của số liệu Fisher.
Hãy xem xét một họ phân phối xác suất tham số (được cho bởi mật độ trong R n ), trong đó x là một biến ngẫu nhiên và theta là một tham số trong R p . Tất cả các bạn có thể biết rằng ma trận thông tin câu cá F = ( F i j ) làD=(f(x,θ))RnxRpF=(Fij)
Fij=E[d(logf(x,θ))/dθid(logf(x,θ))/dθj]
Với ký hiệu này là một đa tạp Riemannian và F ( θ ) là một tensor metric Riemann. (Sự quan tâm của số liệu này được đưa ra bởi định lý ràng buộc thấp hơn Rao)DF(θ)
Bạn có thể nói ... OK trừu tượng toán học nhưng KL ở đâu?
Đó không phải là sự trừu tượng hóa toán học, nếu bạn thực sự có thể tưởng tượng mật độ tham số của bạn là một đường cong (thay vì một tập hợp con của một không gian có kích thước vô hạn) và F 11 được kết nối với độ cong của đường cong đó ... (xem phần chính bài viết của Bradley Efron http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176343282 )p=1F11
Câu trả lời hình học vào một phần của điểm a / trong câu hỏi của bạn: khoảng cách bình phương giữa hai (đóng) phân phối p ( x , θ ) và p ( x , θ + d θ ) trên đa dạng (nghĩ về khoảng cách đo đạc trên trái đất của hai điểm gần nhau, nó liên quan đến độ cong của trái đất) được cho bởi dạng bậc hai:ds2p(x,θ)p(x,θ+dθ)
ds2=∑Fijdθidθj
và nó được biết đến là hai lần Phân kỳ Kullback Leibler:
ds2=2KL(p(x,θ),p(x,θ+dθ))
Nếu bạn muốn tìm hiểu thêm về điều đó, tôi khuyên bạn nên đọc bài viết từ Amari
http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176345779
(Tôi nghĩ đó cũng là một cuốn sách từ Amari hình học riemannian trong thống kê nhưng tôi không nhớ tên)