Câu trả lời là có, nhưng bạn phải xác định nó đúng cách.
pq
H( p , q) = - Σyp ( y) đăng nhậpq( y)
pqx0y0
- ΣyTôi{ y= y0} nhật kýq( y| x0) = - đăng nhậpq( y0| x0)
I{⋅}
Trong trường hợp các nhãn 'mềm' như bạn đề cập, các nhãn không còn là bản sắc lớp nữa, mà là xác suất của hai lớp có thể. Do đó, bạn không thể sử dụng biểu thức chuẩn cho mất nhật ký. Nhưng, khái niệm entropy chéo vẫn được áp dụng. Trong thực tế, nó có vẻ tự nhiên hơn trong trường hợp này.
ys(x)x
p(y∣x)={s(x)1−s(x)If y=1If y=0
Trình phân loại cũng cung cấp một phân phối trên các lớp, cho đầu vào:
q(y∣x)={c(x)1−c(x)If y=1If y=0
c(x)x
pq{0,1}
H(p,q)==−p(y=0∣x)logq(y=0∣x)−p(y=1∣x)logq(y=1∣x)−(1−s(x))log(1−c(x))−s(x)logc(x)
Đó là biểu thức cho một điểm dữ liệu quan sát duy nhất. Hàm mất sẽ là giá trị trung bình trên tất cả các điểm dữ liệu. Tất nhiên, điều này có thể được khái quát để phân loại đa lớp là tốt.