Chỉnh sửa cuối cùng với tất cả các tài nguyên được cập nhật:
Đối với một dự án, tôi đang áp dụng các thuật toán học máy để phân loại.
Thách thức: Khá hạn chế dữ liệu được dán nhãn và dữ liệu chưa được gắn nhãn nhiều hơn.
Bàn thắng:
- Áp dụng phân loại bán giám sát
- Áp dụng quy trình ghi nhãn bán giám sát bằng cách nào đó (được gọi là học tập tích cực)
Tôi đã tìm thấy rất nhiều thông tin từ các tài liệu nghiên cứu, như áp dụng EM, Transductive SVM hoặc S3VM (Semi Supervised SVM) hoặc bằng cách nào đó sử dụng LDA, v.v. Thậm chí có rất ít sách về chủ đề này.
Câu hỏi: Đâu là việc thực hiện và nguồn thực tế?
Cập nhật cuối cùng (dựa trên sự giúp đỡ được cung cấp bởi mpiktas, bayer và Dikran Marsupial)
Học bán giám sát:
- TSVM: trong SVMligth và SVMlin .
- EM Naive Bayes trong Python
- EM trong dự án LinePipe
Học tập tích cực:
- Nhị nguyên : triển khai học tập tích cực với mã nguồn trên phân loại văn bản
- Trang web này phục vụ một cái nhìn tổng quan tuyệt vời về học tập tích cực.
- Một hội thảo thiết kế thử nghiệm: ở đây .
Học kĩ càng:
- Video giới thiệu tại đây .
- Trang web tổng hợp .
- Hướng dẫn học tập và học tập sâu không có giám sát của Stanford .