Vào năm 1946, nhà địa lý học và nhà thống kê Bayes Harold Jeffreys đã giới thiệu cái mà ngày nay chúng ta gọi là phân kỳ Kullback-Leibler và phát hiện ra rằng với hai bản phân phối "gần như vô tận" (chúng ta hãy hy vọng rằng các chàng trai Math SE không thấy điều này ;-) chúng ta có thể viết phân kỳ Kullback-Leibler của chúng như một dạng bậc hai có hệ số được đưa ra bởi các yếu tố của ma trận thông tin Fisher. Ông giải thích dạng bậc hai này là phần tử độ dài của đa tạp Riemannian, với thông tin Fisher đóng vai trò của số liệu Riemannian. Từ mô hình thống kê mô hình thống kê này, ông đã đưa ra Jeffreys của mình trước khi biện pháp được tạo ra một cách tự nhiên bởi số liệu Riemannian và biện pháp này có thể được hiểu là một phân phối thống nhất nội tại trên đa tạp, mặc dù, nói chung, nó không phải là một biện pháp hữu hạn.
Để viết một bằng chứng nghiêm ngặt, bạn sẽ cần phải tìm ra tất cả các điều kiện thông thường và quan tâm đến thứ tự các điều khoản lỗi trong bản mở rộng Taylor. Dưới đây là một bản phác thảo ngắn gọn của các đối số.
Sự phân kỳ Kullback-Leibler đối xứng giữa hai mật độ và được định nghĩa làfg
D [ f, g] = ∫( f( x ) - g( x ) ) nhật ký( f( x )g( x )) dx.
Nếu chúng ta có một họ mật độ được tham số hóa bởi , thìθ = ( θ1, ... , θk)
D [ p (⋅∣ θ ) , p (⋅∣ θ + Δ θ ) ] = ∫(p(x,∣θ)−p(x∣θ+Δθ))log(p(x∣θ)p(x∣θ+Δθ))dx,
trong đó . Giới thiệu ký hiệu
một số đại số đơn giản cho
Sử dụng bản mở rộng Taylor cho logarit tự nhiên, chúng ta có
Δθ=(Δθ1,…,Δθk)Δ p ( x ∣ θ ) = p ( x ∣ θ ) - p ( x ∣ θ + Δ θ ),
D [ p (⋅∣ θ ) , p (⋅∣ θ + Δ θ ) ] = ∫Δ p ( x | q )p ( x | q )đăng nhập( 1 + Δ p ( x | q )p ( x | q )) P(x|q)dx.
đăng nhập( 1 + Δ p ( x | q )p ( x | q )) ≈ delta p ( x | q )p ( x | q ),
D [ p (
và do đó
Nhưng
Do đó
trong đó
D [ p (⋅∣ θ ) , p (⋅| Q + delta q ) ] ≈ ∫( Δ p ( x | q )p ( x | q ))2p ( x | q )dx.
Δ p ( x | q )p ( x | q )≈ 1p ( x | q )Σi = 1k∂p ( x | q )∂θtôiΔ θtôi= ∑i = 1k∂đăng nhậpp ( x | q )∂θtôiΔ θtôi.
D [ p (⋅∣ θ ) , p (⋅| Q + delta q ) ] ≈ Σi , j = 1kgtôi jΔ θtôiΔ θj,
gtôi j= ∫∂đăng nhậpp ( x | q )∂θtôi∂đăng nhậpp ( x | q )∂θjp ( x | q)dx.
Đây là bài báo gốc:
Jeffreys, H. (1946). Một hình thức bất biến cho xác suất trước trong các vấn đề ước tính. Proc. Hoàng Sóc. của Luân Đôn, Sê-ri A, 186, 453 Trực461.