Gần đây tôi đã làm việc với các tập dữ liệu lớn và tìm thấy rất nhiều bài viết về phương pháp phát trực tuyến. Đến tên một vài:
- Theo dõi thường xuyên và lãnh đạo gương: Định lý tương đương và chính quy hóa L1 ( http://jmlr.org/proceedings/ con / v15 / mcmahan11b / mcmahan11b.pdf )
- Học trực tuyến: Các SVM một lượt ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf )
- Pegasos: Trình điều khiển phụ GrAdient ước tính tối ưu cho SVM http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf
- hoặc ở đây: SVM có thể phát trực tuyến một ví dụ không?
- Truyền các khu rừng ngẫu nhiên ( http://research.cs.queensu.ca/home/cords2/ideas07.pdf )
Tuy nhiên, tôi không thể tìm thấy bất kỳ tài liệu nào liên quan đến cách họ so sánh với nhau. Mỗi bài viết tôi đọc dường như chạy thử nghiệm trên tập dữ liệu khác nhau.
Tôi biết về sofia-ml, vowpal wợi, nhưng họ dường như thực hiện rất ít phương pháp, so với số lượng lớn các phương pháp hiện có!
Là các thuật toán ít phổ biến không đủ hiệu suất? Có bài báo nào cố gắng xem lại càng nhiều phương pháp càng tốt không?