Bạn đã thực sự đánh vào một cái gì đó của một câu hỏi mở trong tài liệu. Như bạn nói, có nhiều loại hạt nhân (ví dụ: hàm tuyến tính, cơ sở xuyên tâm, sigmoid, đa thức) và sẽ thực hiện nhiệm vụ phân loại của bạn trong một không gian được xác định bởi các phương trình tương ứng của chúng. Theo hiểu biết của tôi, không ai đã chỉ ra một cách dứt khoát rằng một hạt nhân luôn hoạt động tốt nhất trên một loại nhiệm vụ phân loại văn bản so với loại khác.
Một điều cần xem xét là mỗi hàm kernel có 1 hoặc nhiều tham số cần được tối ưu hóa cho tập dữ liệu của bạn, điều đó có nghĩa là, nếu bạn đang thực hiện đúng cách, bạn nên có một bộ sưu tập đào tạo thứ hai mà bạn có thể điều tra các giá trị tốt nhất cho các tham số này. (Tôi nói là một bộ sưu tập giữ thứ hai, bởi vì bạn đã có một bộ sưu tập mà bạn đang sử dụng để tìm ra các tính năng đầu vào tốt nhất cho trình phân loại của bạn.) Tôi đã thực hiện một thử nghiệm một lúc trong đó tôi đã tối ưu hóa quy mô lớn cho từng các tham số này cho một nhiệm vụ phân loại văn bản đơn giản và thấy rằng mỗi hạt nhân dường như hoạt động tốt, nhưng đã làm như vậy ở các cấu hình khác nhau. Nếu tôi nhớ chính xác kết quả của mình, sigmoid đã hoạt động tốt nhất, nhưng đã làm như vậy ở các điều chỉnh tham số rất cụ thể - những điều khiến tôi mất hơn một tháng để tìm máy.