Thông thường, quyết định là sử dụng hạt nhân tuyến tính hay hạt nhân RBF (hay còn gọi là Gaussian). Có hai yếu tố chính cần xem xét:
- Việc giải quyết vấn đề tối ưu hóa cho kernel tuyến tính nhanh hơn nhiều , xem ví dụ LIBLINEAR.
- Thông thường, hiệu suất dự đoán tốt nhất có thể là tốt hơn cho hạt nhân phi tuyến (hoặc ít nhất là tốt như hạt nhân tuyến tính).
Người ta đã chứng minh rằng kernel tuyến tính là phiên bản suy biến của RBF , do đó kernel tuyến tính không bao giờ chính xác hơn kernel RBF được điều chỉnh đúng. Trích dẫn tóm tắt từ bài báo tôi liên kết:
Phân tích cũng chỉ ra rằng nếu lựa chọn mô hình hoàn chỉnh sử dụng hạt nhân Gaussian đã được tiến hành, thì không cần phải xem xét SVM tuyến tính.
Một quy tắc cơ bản của ngón tay cái được trình bày ngắn gọn trong hướng dẫn thực tế của NTU để hỗ trợ phân loại vectơ (Phụ lục C).
Nếu số lượng tính năng lớn, người ta có thể không cần ánh xạ dữ liệu lên không gian chiều cao hơn. Đó là, ánh xạ phi tuyến không cải thiện hiệu suất. Sử dụng kernel tuyến tính là đủ tốt và người ta chỉ tìm kiếm tham số C.
Kết luận của bạn ít nhiều đúng nhưng bạn có lập luận ngược. Trong thực tế, hạt nhân tuyến tính có xu hướng hoạt động rất tốt khi số lượng tính năng lớn (ví dụ: không cần ánh xạ tới không gian tính năng chiều cao hơn nữa). Một ví dụ điển hình của việc này là phân loại tài liệu, với hàng ngàn kích thước trong không gian đầu vào.
Trong những trường hợp đó, hạt nhân phi tuyến không nhất thiết phải chính xác hơn đáng kể so với hạt nhân tuyến tính. Điều này về cơ bản có nghĩa là các hạt nhân phi tuyến mất đi sự hấp dẫn của chúng: chúng đòi hỏi nhiều nguồn lực hơn để đào tạo với ít hoặc không đạt được hiệu suất dự đoán, vậy tại sao phải bận tâm.
TL; DR
Luôn luôn thử tuyến tính trước vì nó là cách nhanh hơn để đào tạo (AND test). Nếu độ chính xác đủ, hãy vỗ nhẹ vào lưng để hoàn thành tốt công việc và chuyển sang vấn đề tiếp theo. Nếu không, hãy thử một hạt nhân phi tuyến.