Tôi quan sát thấy rằng Caffe (một khung học tập sâu) đã sử dụng Lớp mất Softmax SoftmaxWithLoss
làm lớp đầu ra cho hầu hết các mẫu mô hình .
Theo như tôi biết, lớp Softmax Loss là sự kết hợp của Lớp mất logistic đa cực và lớp Softmax .
Từ Caffe, họ nói rằng
Tính toán độ dốc lớp Softmax ổn định hơn về mặt số
Tuy nhiên, lời giải thích này không phải là câu trả lời mà tôi muốn, lời giải thích chỉ là so sánh sự kết hợp của Lớp mất đa phương thức logistic và lớp mất Softmax thay vì từng lớp. Nhưng không so sánh với các loại chức năng mất.
Tuy nhiên, tôi muốn biết thêm sự khác biệt / ưu điểm / nhược điểm của 3 chức năng lỗi này là Mất logistic đa thức , Entropy chéo (CE) và Lỗi vuông (SE) trong quan điểm học tập có giám sát là gì? Bất kỳ bài viết hỗ trợ?
y-t
. willamette.edu/~gorr/groupes/cs449/ classify.html