Sự hiểu biết của tôi về SVM là nó rất giống với hồi quy logistic (LR), tức là một tổng số các tính năng được truyền cho hàm sigmoid để có xác suất thuộc về một lớp, nhưng thay vì mất entropy chéo (logistic) chức năng, đào tạo được thực hiện bằng cách sử dụng mất bản lề. Lợi ích của việc sử dụng mất bản lề là người ta có thể thực hiện nhiều thủ thuật số khác nhau để làm cho quá trình nhân hóa hiệu quả hơn. Tuy nhiên, một nhược điểm là mô hình kết quả có ít thông tin hơn mô hình LR tương ứng có thể có. Vì vậy, ví dụ, nếu không có nhân (sử dụng nhân tuyến tính), ranh giới quyết định SVM vẫn sẽ ở cùng một vị trí nơi LR sẽ đưa ra xác suất 0,5, nhưng NHƯNG người ta không thể biết xác suất thuộc về một lớp phân rã nhanh như thế nào ranh giới quyết định.
Hai câu hỏi của tôi là:
- Là giải thích của tôi ở trên là chính xác?
- Làm thế nào để sử dụng mất bản lề làm cho nó không hợp lệ để diễn giải kết quả SVM là xác suất?