Đối với hai phân phối rời rạc và , entropy chéo được định nghĩa làq
Tôi tự hỏi tại sao điều này sẽ là một thước đo trực quan về khoảng cách giữa hai phân phối xác suất?
Tôi thấy rằng là entropy của , đo lường "sự bất ngờ" của . là số đo thay thế một phần bằng . Tôi vẫn không hiểu ý nghĩa trực quan đằng sau định nghĩa.p p H ( p , q ) p q