Làm thế nào là SVMs = So khớp mẫu?


10

Tôi đã đọc về các SVM và được biết rằng họ đang giải quyết một vấn đề tối ưu hóa và ý tưởng lề tối đa là rất hợp lý.

Bây giờ, bằng cách sử dụng hạt nhân, họ có thể tìm thấy các ranh giới phân tách phi tuyến tính, điều này thật tuyệt vời.

Cho đến nay, tôi thực sự không biết làm thế nào các SVM (một máy nhân đặc biệt) và các máy kernel có liên quan đến các mạng thần kinh?

Hãy xem xét các ý kiến ​​của Yann Lecun => tại đây :

kernel methods were a form of glorified template matching

ở đây nữa :

Ví dụ, một số người bị lóa mắt bởi các phương thức kernel vì phép toán dễ thương đi cùng với nó. Nhưng, như tôi đã nói trước đây, cuối cùng, các máy kernel là các mạng nông thực hiện khuôn mẫu được tôn vinh phù hợp với J. Không có gì sai với điều đó (SVM là một phương pháp tuyệt vời), nhưng nó có những hạn chế nghiêm trọng mà tất cả chúng ta nên nhận thức được.

Vì vậy, câu hỏi của tôi là:

  1. SVM liên quan đến mạng lưới thần kinh như thế nào? Làm thế nào nó là một mạng nông?
  2. SVM giải quyết vấn đề tối ưu hóa với hàm mục tiêu được xác định rõ, làm thế nào để thực hiện khớp mẫu? Mẫu ở đây mà đầu vào được khớp là gì?

Tôi đoán những nhận xét này cần có sự hiểu biết thấu đáo về không gian chiều cao, mạng lưới thần kinh và máy hạt nhân nhưng cho đến nay tôi đã cố gắng và không thể nắm bắt được logic đằng sau nó. Nhưng chắc chắn là rất thú vị khi lưu ý các kết nối giữa hai kỹ thuật ml rất khác nhau.

EDIT: Tôi nghĩ rằng việc hiểu các SVM từ góc độ thần kinh sẽ là tuyệt vời. Tôi đang tìm kiếm một câu trả lời thấu đáo về toán học cho hai câu hỏi trên, để thực sự hiểu được mối liên kết giữa SVM và Neural Nets, cả trong trường hợp SVM tuyến tính và SVM với thủ thuật kernel.


Các SVM khá dễ dàng và nhanh chóng để đào tạo một hạt nhân thích hợp. Một số nhiệm vụ không cần mạng lưới thần kinh sâu.
Vladislavs Dovgalecs

@xeon hi, bạn có thể xem câu trả lời không, tôi cho rằng nó cần cải thiện. cảm ơn.
Rafael

Câu trả lời:


7
  1. SVM liên quan đến mạng lưới thần kinh như thế nào? Làm thế nào nó là một mạng nông?

SVM là một mạng nơ ron một lớp với chức năng mất bản lề là chức năng mất và kích hoạt tuyến tính độc quyền. Khái niệm này đã được ám chỉ trong các chủ đề trước đó, chẳng hạn như chủ đề này: NeuralNetwork một lớp với kích hoạt RelU bằng với SVM?

  1. SVM giải quyết vấn đề tối ưu hóa với hàm mục tiêu được xác định rõ, làm thế nào để thực hiện khớp mẫu? Mẫu ở đây mà đầu vào được khớp là gì?

Ma trận Gram (Ma trận hạt nhân, nếu bạn thích) là thước đo tương tự. Vì SVM cho phép các giải pháp thưa thớt, dự đoán trở thành vấn đề so sánh mẫu của bạn với các mẫu, tức là các vectơ hỗ trợ.


cảm ơn câu trả lời, xin vui lòng giải thích thêm một chút với một số toán học tốt hơn. Điều đó sẽ thực sự tuyệt vời :)
Rafael

Tôi ít nhiều hiểu được điều phù hợp với mẫu, nhưng tôi đã không nhận được tuyên bố: Vì SVM cho phép các giải pháp thưa thớt .. các giải pháp thưa thớt phải làm gì ở đây? Dự đoán theo định nghĩa được thực hiện bằng sự tương đồng cân nặng với các mẫu, vì vậy tôi không biết được sự thưa thớt đến từ đâu. Ngoài ra, vui lòng thêm một vài dòng liên quan đến chức năng kích hoạt mất bản lề. Cảm ơn rất nhiều :)
Rafael
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.