Tại sao phân kỳ KL không âm?
Từ quan điểm của lý thuyết thông tin, tôi có một sự hiểu biết trực quan như vậy:
Giả sử có hai nhóm và được tạo thành từ cùng một tập hợp các phần tử được dán nhãn bởi . và là các phân phối xác suất khác nhau so với nhóm và tương ứng.
Từ quan điểm của lý thuyết thông tin, là số tiền ít nhất của các bit mà yêu cầu để ghi lại một yếu tố x cho hòa tấu Một . Vì vậy, kỳ vọng ∑ x ∈ e n s e m b l e - p ( x ) ln ( p ( x ) ) có thể được hiểu là ít nhất là bao nhiêu bit mà chúng ta cần để ghi một phần tử trong A trung bình.
Vì công thức này đặt trung bình thấp hơn cho các bit mà chúng ta cần trung bình, do đó, đối với một nhóm khác nhau mang lại phân phối xác suất khác nhau q ( x ) , ràng buộc mà nó đưa ra cho mỗi phần tử x chắc chắn sẽ không phải là bit được cho bởi p ( x ) , có nghĩa là lấy kỳ vọng, ∑ x ∈ e n s e m b l e - p ( x ) ln ( q ( x ) )
Tôi không đặt≥ở đây vìp(x)vàq(x)khác nhau.
Đây là sự hiểu biết trực quan của tôi, có một cách thuần túy toán học để chứng minh phân kỳ KL là không âm? Vấn đề có thể được nêu là:
Làm thế nào điều này có thể được chứng minh? Hoặc điều này có thể được chứng minh mà không cần điều kiện thêm?