Tại sao không luôn luôn sử dụng học tập đồng bộ?


13

Dường như đối với tôi, việc học tập SILL luôn mang lại hiệu quả dự đoán tốt hơn so với chỉ một giả thuyết học tập duy nhất.

Vậy tại sao chúng ta không sử dụng chúng mọi lúc?

Tôi đoán là vì có lẽ, giới hạn tính toán? (ngay cả khi đó, chúng tôi sử dụng các yếu tố dự đoán yếu, vì vậy tôi không biết).


2
Bởi vì việc học tập không phải lúc nào cũng mang lại hiệu quả tốt hơn. Cả hai đóng gói và tăng cường công việc trong một số trường hợp nhưng có thể làm giảm hiệu suất nghiêm trọng ở những người khác.
Marc Claesen

Câu trả lời:


12

Nói chung không phải là nó sẽ luôn hoạt động tốt hơn. Có một số phương pháp tập hợp, mỗi phương pháp có ưu điểm / điểm yếu riêng. Cái nào để sử dụng và sau đó phụ thuộc vào vấn đề trong tay.

Ví dụ: nếu bạn có các mô hình có phương sai cao (chúng phù hợp với dữ liệu của bạn), thì bạn có thể được hưởng lợi từ việc sử dụng đóng bao. Nếu bạn có các mô hình thiên vị, tốt hơn là kết hợp sử dụng chúng với Boosting. Ngoài ra còn có các chiến lược khác nhau để tạo thành quần thể. Chủ đề chỉ quá rộng để bao quát nó trong một câu trả lời.

Nhưng quan điểm của tôi là: nếu bạn sử dụng phương pháp tập hợp sai cho cài đặt của mình, bạn sẽ không làm tốt hơn. Ví dụ: sử dụng Bagging với mô hình thiên vị sẽ không có ích.

Ngoài ra, nếu bạn cần làm việc trong môi trường xác suất, các phương thức tập hợp cũng có thể không hoạt động. Được biết , Boosting (ở dạng phổ biến nhất như AdaBoost) mang lại ước tính xác suất kém. Đó là, nếu bạn muốn có một mô hình cho phép bạn suy luận về dữ liệu của mình, không chỉ phân loại, bạn có thể tốt hơn với một mô hình đồ họa.


Một gốc cây quyết định là sai lệch, nhưng chúng đã được sử dụng thành công với việc đóng bao.

vâng, nhưng bản hòa tấu vẫn thiên vị. Điều gì xảy ra nếu sự thiên vị thực sự là một vấn đề ?. Đóng bao sẽ không giúp khắc phục nó. Bạn có thể thêm một tài liệu tham khảo cho trường hợp mà bạn đề cập?
jpmuc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.