Các SVM tuyến tính và hồi quy logistic thường thực hiện tương đương trong thực tế. Sử dụng SVM với hạt nhân phi tuyến nếu bạn có lý do để tin rằng dữ liệu của bạn sẽ không thể phân tách tuyến tính (hoặc bạn cần mạnh mẽ hơn để vượt trội hơn so với LR thường chịu đựng). Mặt khác, chỉ cần thử hồi quy logistic trước và xem cách bạn làm với mô hình đơn giản hơn đó. Nếu hồi quy logistic làm bạn thất bại, hãy thử một SVM với hạt nhân phi tuyến tính như RBF.
CHỈNH SỬA:
Ok, hãy nói về nơi các chức năng khách quan đến từ đâu.
Hồi quy logistic xuất phát từ hồi quy tuyến tính tổng quát. Một cuộc thảo luận tốt về chức năng mục tiêu hồi quy logistic trong bối cảnh này có thể được tìm thấy ở đây: https://stats.stackexchange.com/a/29326/8451
Thuật toán Support Vector Machines có động lực hình học hơn nhiều . Thay vì giả định một mô hình xác suất, chúng tôi đang cố gắng tìm một siêu phẳng tách biệt tối ưu cụ thể, nơi chúng tôi xác định "sự tối ưu" trong bối cảnh của các vectơ hỗ trợ. Chúng ta không có gì giống với mô hình thống kê mà chúng ta sử dụng trong hồi quy logistic ở đây, mặc dù trường hợp tuyến tính sẽ cho chúng ta kết quả tương tự: thực sự điều này chỉ có nghĩa là hồi quy logistic thực hiện công việc phân loại "lề rộng" khá tốt, vì đó là tất cả các SVM đang cố gắng thực hiện (cụ thể, SVM đang cố gắng "tối đa hóa" lề giữa các lớp).
Tôi sẽ cố gắng quay lại vấn đề này sau và tìm hiểu sâu hơn một chút về cỏ dại, tôi chỉ sắp xếp một thứ gì đó: p