Có một tuyên bố rằng tối đa hóa khả năng là tương đương với giảm thiểu entropy chéo. Có bằng chứng nào cho tuyên bố này không?
Có một tuyên bố rằng tối đa hóa khả năng là tương đương với giảm thiểu entropy chéo. Có bằng chứng nào cho tuyên bố này không?
Câu trả lời:
Đối với nhãn , khả năng một số dữ liệu nhị phân theo mô hình Bernoulli có tham số là
trong khi khả năng là
Và entropy chéo nhị phân là
Rõ ràng, .
Chúng tôi biết rằng giá trị tối ưu là giống nhau cho cả hai vì chúng tôi có thể quan sát rằng với bất kỳ nào không tối ưu, chúng tôi có , giữ cho mọi . (Hãy nhớ rằng, chúng tôi muốn giảm thiểu entropy chéo , vì vậy tối ưu có ít nhất .)
Tương tự, chúng ta biết rằng giá trị tối ưu là giống nhau cho và vì là hàm tăng đơn điệu cho , vì vậy chúng ta có thể viết . (Hãy nhớ rằng, chúng tôi muốn tối đa hóa khả năng , vì vậy tối ưu có nhiều .)
Một số nguồn bỏ qua từ entropy chéo. Rõ ràng, điều này chỉ thay đổi giá trị của , nhưng không thay đổi vị trí của tối ưu, do đó, từ góc độ tối ưu hóa, sự khác biệt không quan trọng. Tuy nhiên, dấu hiệu tiêu cực rõ ràng rất quan trọng vì đó là sự khác biệt giữa tối đa hóa và tối thiểu hóa!