Trước hết, tôi nhận ra nếu tôi cần thực hiện dự đoán nhị phân, tôi phải tạo ít nhất hai lớp thông qua thực hiện mã hóa một nóng. Điều này có đúng không? Tuy nhiên, có phải entropy chéo nhị phân chỉ dành cho dự đoán chỉ có một lớp không? Nếu tôi sử dụng một mất mát entropy chéo phân loại thường được tìm thấy trong hầu hết các thư viện (như TensorFlow), liệu có sự khác biệt đáng kể?
Trong thực tế, sự khác biệt chính xác giữa một entropy chéo phân loại và nhị phân là gì? Tôi chưa bao giờ thấy việc thực hiện entropy chéo nhị phân trong TensorFlow vì vậy tôi nghĩ có lẽ phân loại này hoạt động tốt như vậy.