Không cần trích dẫn nguồn, Wikipedia định nghĩa entropy chéo của các phân phối rời rạc và Q là
Ai là người đầu tiên bắt đầu sử dụng số lượng này? Và ai đã phát minh ra thuật ngữ này? Tôi nhìn vào:
JE Shore và RW Johnson, "Xuất phát từ nguyên lý của entropy tối đa và nguyên tắc entropy tối thiểu," Lý thuyết thông tin, Giao dịch theo chuẩn của IEEE, tập. 26, không 1, trang 26-37, tháng 1 năm 1980.
Tôi đã làm theo lời giới thiệu của họ về
A. Wehrl, "Tính chất chung của entropy," Nhận xét về Vật lý hiện đại, tập. 50, không 2, trang 221-260, tháng 4 năm 1978.
người không bao giờ sử dụng thuật ngữ.
Cũng như thế
S. Kullback và R. Leibler, "Về thông tin và sự đầy đủ", Biên niên sử về thống kê toán học, tập. 22, không. 1, trang 79-86, 1951.
Tôi nhìn vào
TM Cover và JA Thomas, Các yếu tố của lý thuyết thông tin (Dòng Wiley trong viễn thông và xử lý tín hiệu). Wiley-Interscience, 2006.
và
I. Tốt, "Entropy tối đa cho việc xây dựng giả thuyết, đặc biệt là cho các bảng dự phòng đa chiều," Biên niên sử về thống kê toán học, tập. 34, không 3, trang 911-934, 1963.
nhưng cả hai bài báo đều xác định entropy chéo là đồng nghĩa với phân kỳ KL.
Giấy gốc
CE Shannon, "Một lý thuyết toán học về truyền thông", tạp chí kỹ thuật hệ thống Bell, tập. 27, 1948.
Không đề cập đến entropy chéo (và có một định nghĩa lạ về "entropy tương đối": "Tỷ lệ của entropy của một nguồn so với giá trị tối đa mà nó có thể có trong khi vẫn bị giới hạn trong cùng các ký hiệu").
Cuối cùng, tôi tìm trong một số sách và giấy tờ cũ của Tribus.
Có ai biết phương trình trên được gọi là gì, và ai đã phát minh ra nó hoặc có một bài thuyết trình hay về nó?