Những loại vấn đề học tập phù hợp cho Support Vector Machines?


16

Các dấu hiệu hoặc tính chất chỉ ra rằng một vấn đề học tập nhất định có thể được giải quyết bằng cách sử dụng các máy vectơ hỗ trợ?

Nói cách khác, điều gì là khi bạn gặp vấn đề về học tập, khiến bạn phải thốt lên "ồ tôi chắc chắn nên sử dụng các SVM cho việc này" chứ không phải là mạng thần kinh hoặc cây quyết định hay bất cứ điều gì khác?


Đã xóa supervised learningthẻ, vì SVM cũng có thể được sử dụng trong các vấn đề học tập không được giám sát .
Dawny33

Có thể giải thích làm thế nào Svm có thể được sử dụng cho vấn đề không được giám sát và gói nào thực hiện nó?
GeorgeOfTheRF

@ML_Pro Vui lòng đi qua liên kết tôi đã đưa vào nhận xét của mình.
Dawny33

3
@ Dawny33, việc áp dụng các SVM vào việc học tập không giám sát là ngoại lệ và không phải là quy tắc. SVM là một phương pháp học tập có giám sát.
AN6U5

1
@ AN6U5 Cảm ơn bạn đã thông báo :) Bởi exception, ý bạn là đó chỉ là một tinh chỉnh chứ không phải quy ước, phải không?
Dawny33

Câu trả lời:


7

SVM có thể được sử dụng để phân loại (phân biệt giữa một số nhóm hoặc lớp) và hồi quy (có được một mô hình toán học để dự đoán một cái gì đó). Chúng có thể được áp dụng cho cả các vấn đề tuyến tính và phi tuyến tính.

Cho đến năm 2006, chúng là thuật toán có mục đích chung tốt nhất cho máy học. Tôi đã cố gắng tìm một bài báo so sánh nhiều triển khai của các thuật toán được biết đến nhiều nhất: svm, mạng lưới thần kinh, cây cối, v.v. Tôi không thể thấy nó xin lỗi (bạn sẽ phải tin tôi, điều tồi tệ). Trong bài báo, thuật toán có hiệu năng tốt nhất là svm, với thư viện libsvm.

Năm 2006, Hinton đã đưa ra những kiến ​​thức chuyên sâu và mạng lưới thần kinh. Ông đã cải thiện tình trạng hiện tại của nghệ thuật ít nhất 30%, đó là một tiến bộ rất lớn. Tuy nhiên học sâu chỉ có được hiệu suất tốt cho các bộ đào tạo lớn. Nếu bạn có một bộ đào tạo nhỏ, tôi sẽ đề nghị sử dụng svm.

Hơn nữa, bạn có thể tìm thấy ở đây một infographic hữu ích về thời điểm sử dụng các thuật toán học máy khác nhau bằng scikit-learn. Tuy nhiên, theo hiểu biết tốt nhất của tôi, không có sự thỏa thuận nào giữa cộng đồng khoa học về việc nếu một vấn đề có các tính năng X, Y và Z thì tốt hơn là sử dụng svm. Tôi sẽ đề nghị thử các phương pháp khác nhau. Ngoài ra, đừng quên rằng Svm hoặc mạng lưới thần kinh chỉ là một phương pháp để tính toán một mô hình. Nó rất quan trọng cũng như các tính năng bạn sử dụng.


1
@HoapHumaboid Tôi biết về SVC và SVR và chúng tôi có thể sử dụng Kernels để áp dụng SVM cho NLP và tôi biết các bài báo so sánh SVM với các thuật toán học tập khác ... Tôi đã tự hỏi về các đặc điểm của một vấn đề học tập tiềm năng sẽ làm điều hiển nhiên là nó nên được xử lý bằng một SVM. Nói cách khác, điều gì xảy ra khi bạn gặp vấn đề về học tập khiến bạn phải thốt lên "ồ tôi chắc chắn nên sử dụng SVM cho việc này" thay vì NN hoặc cây quyết định hoặc bất cứ điều gì khác
Ragnar

@Ragnar vui lòng xem phản hồi đã được chỉnh sửa của tôi
hoaphumanoid

2

Hãy giả sử rằng chúng ta đang ở trong một thiết lập phân loại.

Đối với svmkỹ thuật tính năng là nền tảng:

  • các bộ phải được phân tách tuyến tính. Mặt khác, dữ liệu cần phải được chuyển đổi (ví dụ: sử dụng Kernels). Điều này không được thực hiện bởi chính algo và có thể thổi bay số lượng tính năng.
  • Tôi sẽ nói rằng svmhiệu suất bị ảnh hưởng khi chúng tôi tăng số lượng kích thước nhanh hơn các phương pháp khác (tập hợp cây). Điều này là do vấn đề tối ưu hóa bị ràng buộc mà sao lưu svms. Đôi khi việc giảm tính năng là khả thi, đôi khi không và đây là khi chúng ta thực sự không thể mở đường cho việc sử dụng hiệu quảsvm
  • svmsẽ có khả năng đấu tranh với một tập dữ liệu trong đó số lượng tính năng lớn hơn nhiều so với số lượng quan sát. Điều này, một lần nữa, có thể được hiểu bằng cách xem xét vấn đề tối ưu bị hạn chế.
  • Các biến phân loại không được xử lý ra khỏi hộp bằng svmthuật toán.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.