Tôi chưa quen với học máy và cố gắng sử dụng scikit-learn (sklearn) để giải quyết vấn đề phân loại. Cả Quyết định và SVM đều có thể đào tạo một trình phân loại cho vấn đề này.
Tôi sử dụng sklearn.ensemble.RandomForestClassifier
và sklearn.svm.SVC
để phù hợp với cùng một dữ liệu đào tạo (khoảng 500.000 mục với 50 tính năng cho mỗi mục). Các RandomForestClassifier đi ra với một phân loại trong khoảng một phút. Các SVC sử dụng nhiều hơn 24 giờ mà vẫn giữ chạy.
Tại sao SVC thực hiện không hiệu quả? Là dữ liệu được đặt quá lớn cho SVC ? Là SVC không phù hợp cho vấn đề như vậy?