Phương pháp hạt nhân có thể được sử dụng cho các vấn đề được giám sát và không giám sát. Các ví dụ nổi tiếng là máy vectơ hỗ trợ và phân cụm phổ hạt nhân , tương ứng.
Các phương thức kernel cung cấp một cách có cấu trúc để sử dụng thuật toán tuyến tính trong không gian tính năng được chuyển đổi, trong đó phép biến đổi thường là phi tuyến (và đến không gian chiều cao hơn). Ưu điểm chính của cái gọi là thủ thuật kernel này mang lại là các mẫu phi tuyến có thể được tìm thấy với chi phí tính toán hợp lý .
Lưu ý rằng tôi đã nói chi phí tính toán là hợp lý, nhưng không đáng kể. Các phương thức kernel thường xây dựng một ma trận kernel với số lượng phiên bản đào tạo. Do đó, độ phức tạp của các phương thức kernel là một hàm của số lượng các trường hợp đào tạo, thay vì số lượng kích thước đầu vào. Các máy vectơ hỗ trợ, ví dụ, có độ phức tạp đào tạo giữa và . Đối với các vấn đề với rất lớn , sự phức tạp này hiện đang bị cấm. N O ( N 2 ) O ( N 3 ) NK∈RN×NNO(N2)O(N3)N
Điều này làm cho các phương thức kernel rất thú vị từ góc độ tính toán khi số lượng kích thước lớn và số lượng mẫu tương đối thấp (giả sử, dưới 1 triệu).
Liên quan: Nhân tuyến tính và nhân phi tuyến tính cho máy vectơ hỗ trợ?
SVM cho các vấn đề quy mô lớn
Đối với các vấn đề về chiều rất cao, chẳng hạn như 10000
kích thước bạn đề cập trong câu hỏi, thường không cần ánh xạ tới không gian tính năng chiều cao hơn. Không gian đầu vào đã đủ tốt. Đối với các vấn đề như vậy, các phương thức tuyến tính là các đơn đặt hàng có cường độ nhanh hơn với hiệu suất dự đoán gần như tương tự. Ví dụ về các phương pháp này có thể được tìm thấy trong LIBLINEAR hoặc Vowpal Wợi .
Phương pháp tuyến tính đặc biệt thú vị khi bạn có nhiều mẫu trong không gian đầu vào chiều cao. Khi bạn chỉ có mẫu, sử dụng phương pháp nhân phi tuyến cũng sẽ rẻ (vì nhỏ). Nếu bạn có, ví dụ, mẫu trong kích thước, phương thức kernel sẽ không thể thực hiện được.N 5.000.000 10.000500N5.000.00010.000
Đối với các vấn đề chiều thấp với nhiều trường hợp đào tạo (được gọi là các vấn đề nhỏ lớn ), phương pháp tuyến tính có thể mang lại độ chính xác dự đoán kém. Đối với các vấn đề như vậy, các phương thức tập hợp như MakeembleSVM cung cấp các ranh giới quyết định phi tuyến với chi phí tính toán giảm đáng kể so với SVM tiêu chuẩn.pNp
RBF
kernellibsvm
, nó luôn bị quá mức, bộ phân loại đạt được độ chính xác cao nhưng độ chính xác thấp trong bộ thử nghiệm. Và nếu tôi thực hiện giảm kích thước trước bộ phân loại và kích thước giảm gần với số lượng mẫu đào tạo, bộ phân loại có thể đạt được lợi nhuận tốt giữa bộ đào tạo và thử nghiệm. Liệu kết quả phù hợp với hầu hết các kết quả thực nghiệm? Cảm ơn.