Như tôi đã nghe nói về trình phân loại AdaBoost được nhắc đến nhiều lần trong công việc, tôi muốn có cảm giác tốt hơn về cách thức hoạt động của nó và khi nào người ta có thể muốn sử dụng nó. Tôi đã đi trước và đọc một số bài báo và hướng dẫn về nó mà tôi tìm thấy trên Google, nhưng có những khía cạnh của trình phân loại mà tôi vẫn gặp khó khăn khi hiểu:
Hầu hết các hướng dẫn tôi từng thấy nói về AdaBoost là tìm ra sự kết hợp có trọng số tốt nhất của nhiều phân loại. Điều này có ý nghĩa với tôi. Điều không có ý nghĩa là các triển khai (ví dụ MALLET) trong đó AdaBoost dường như chỉ chấp nhận một người học yếu. Làm thế nào điều này có ý nghĩa gì? Nếu chỉ có một trình phân loại được cung cấp cho AdaBoost, thì nó có nên trả lại cùng một trình phân loại có trọng số 1 không? Làm thế nào để nó tạo ra các phân loại mới từ phân loại đầu tiên?
Khi nào một người thực sự muốn sử dụng AdaBoost? Tôi đã đọc rằng nó được coi là một trong những trình phân loại tốt nhất, nhưng khi tôi thử tăng trình phân loại MaxEnt, tôi đã nhận được điểm số 70% + với, AdaBoost giết chết nó và cho tôi f- thay vào đó, điểm số của 15% với độ thu hồi rất cao và độ chính xác rất thấp. Vì vậy, bây giờ tôi bối rối. Khi nào tôi muốn sử dụng AdaBoost? Tôi đang tìm kiếm nhiều hơn một câu trả lời thống kê trực quan hơn là nghiêm ngặt, nếu có thể.