ANN (Mạng nơ ron nhân tạo) và SVM (Máy vectơ hỗ trợ) là hai chiến lược phổ biến để học và phân loại máy có giám sát. Không thường rõ ràng phương pháp nào tốt hơn cho một dự án cụ thể và tôi chắc chắn câu trả lời luôn là "nó phụ thuộc". Thông thường, sự kết hợp của cả hai cùng với phân loại Bayes được sử dụng.
Những câu hỏi trên Stackoverflow đã được hỏi về ANN vs SVM:
sự khác biệt giữa ANN, SVM và KNN trong câu hỏi phân loại của tôi
Hỗ trợ máy Vector hay Mạng nơ ron nhân tạo để xử lý văn bản?
Trong câu hỏi này, tôi muốn biết cụ thể những khía cạnh nào của ANN (cụ thể là Perceptionron đa lớp) có thể khiến nó mong muốn sử dụng trên một SVM? Lý do tôi hỏi là vì nó dễ trả lời cho câu hỏi ngược lại : Máy Vector hỗ trợ thường vượt trội hơn ANN vì chúng tránh được hai điểm yếu lớn của ANN:
(1) ANN thường hội tụ về cực tiểu địa phương hơn là cực tiểu toàn cầu, nghĩa là đôi khi chúng thực sự "thiếu bức tranh lớn" (hoặc thiếu rừng cho cây)
(2) ANN thường quá phù hợp nếu việc đào tạo diễn ra quá lâu, có nghĩa là đối với bất kỳ mẫu nào, ANN có thể bắt đầu coi nhiễu là một phần của mẫu.
Các SVM không gặp phải một trong hai vấn đề này. Tuy nhiên, không dễ dàng thấy rằng các SVM có nghĩa là một sự thay thế hoàn toàn cho ANN. Vậy ANN có những lợi thế cụ thể nào đối với một SVM có thể khiến nó áp dụng cho các tình huống nhất định? Tôi đã liệt kê các lợi thế cụ thể của một SVM so với ANN, bây giờ tôi muốn xem danh sách các lợi thế của ANN (nếu có).