Khi sử dụng SVM, chúng ta cần chọn kernel.
Tôi tự hỏi làm thế nào để chọn một hạt nhân. Bất kỳ tiêu chí về lựa chọn hạt nhân?
Khi sử dụng SVM, chúng ta cần chọn kernel.
Tôi tự hỏi làm thế nào để chọn một hạt nhân. Bất kỳ tiêu chí về lựa chọn hạt nhân?
Câu trả lời:
Hạt nhân thực sự là một thước đo tương tự, vì vậy, chọn hạt nhân theo kiến thức trước đây về bất biến theo đề xuất của Robin (+1) là một ý tưởng tốt.
Trong trường hợp không có kiến thức chuyên môn, hạt nhân Radial Basis Function tạo ra một hạt nhân mặc định tốt (một khi bạn đã thiết lập thì đó là một vấn đề đòi hỏi một mô hình phi tuyến tính).
Việc lựa chọn các tham số kernel và kernel / chính quy có thể được tự động hóa bằng cách tối ưu hóa lựa chọn mô hình dựa trên giá trị chéo (hoặc sử dụng giới hạn bán kính hoặc giới hạn nhịp). Điều đơn giản nhất cần làm là giảm thiểu tiêu chí lựa chọn mô hình liên tục bằng phương pháp đơn giản Nelder-Mead, không yêu cầu tính toán độ dốc và hoạt động tốt đối với số lượng siêu tham số hợp lý. Nếu bạn có nhiều hơn một vài tham số để điều chỉnh, lựa chọn mô hình tự động có thể dẫn đến sự phù hợp quá mức nghiêm trọng, do sự khác biệt của tiêu chí lựa chọn mô hình. Có thể sử dụng tối ưu hóa dựa trên độ dốc, nhưng hiệu suất đạt được thường không xứng đáng với nỗ lực mã hóa nó).
Tự động lựa chọn các hạt nhân và các tham số kernel / chính quy là một vấn đề khó khăn, vì nó rất dễ phù hợp với tiêu chí lựa chọn mô hình (thường dựa trên xác thực chéo) và bạn có thể kết thúc với một mô hình tồi tệ hơn bạn đã bắt đầu. Lựa chọn mô hình tự động cũng có thể đánh giá hiệu suất thiên vị, vì vậy hãy đảm bảo đánh giá hiệu suất của bạn đánh giá toàn bộ quá trình điều chỉnh mô hình (đào tạo và lựa chọn mô hình), để biết chi tiết, xem
GC Cawley và NLC Talbot, Ngăn chặn sự phù hợp quá mức trong việc lựa chọn mô hình thông qua việc chuẩn hóa siêu tham số Bayes, Tạp chí Nghiên cứu Máy học, tập 8, trang 841-861, tháng 4 năm 2007 (pdf)
và
GC Cawley và NLC Talbot, Quá phù hợp trong lựa chọn mô hình và sai lệch lựa chọn tiếp theo trong đánh giá hiệu suất, Tạp chí Nghiên cứu Máy học, tập. 11, trang 2079-2107, tháng 7 năm 2010 (pdf)
Nếu bạn không chắc chắn điều gì là tốt nhất, bạn có thể sử dụng các kỹ thuật lựa chọn tự động (ví dụ: xác thực chéo, ...). Trong trường hợp này, bạn thậm chí có thể sử dụng kết hợp các phân loại (nếu vấn đề của bạn là phân loại) thu được với các kernel khác nhau.
Tuy nhiên , "lợi thế" khi làm việc với kernel là bạn thay đổi hình dạng "Euclide" thông thường để nó phù hợp với vấn đề của chính bạn. Ngoài ra, bạn thực sự nên cố gắng hiểu sự quan tâm của hạt nhân đối với vấn đề của bạn là gì, cụ thể là gì đối với hình dạng của vấn đề của bạn . Điều này có thể bao gồm:
Tôi luôn có cảm giác rằng bất kỳ lựa chọn siêu tham số nào cho các SVM đều được thực hiện thông qua xác thực chéo kết hợp với tìm kiếm dạng lưới.
Nói chung, hạt nhân RBF là lựa chọn đầu tiên hợp lý. Ngoài ra, hạt nhân tuyến tính là trường hợp đặc biệt của RBF, Đặc biệt, khi số lượng tính năng rất lớn, người ta có thể chỉ sử dụng hạt nhân tuyến tính.