Máy tăng cường độ dốc của Friedman có thể đạt được hiệu suất tốt hơn Rừng ngẫu nhiên của Breiman không? Nếu vậy, trong điều kiện hoặc loại dữ liệu nào có thể làm cho gbm tốt hơn?
Máy tăng cường độ dốc của Friedman có thể đạt được hiệu suất tốt hơn Rừng ngẫu nhiên của Breiman không? Nếu vậy, trong điều kiện hoặc loại dữ liệu nào có thể làm cho gbm tốt hơn?
Câu trả lời:
Phần sau đây cung cấp một lời giải thích về lý do tại sao Boosting thường vượt trội so với Random Forest trong thực tế, nhưng tôi sẽ rất quan tâm để biết những yếu tố khác nhau nào có thể giải thích cạnh của Boosting trên RF trong các cài đặt cụ thể.
Mặt khác, Boosting làm giảm độ lệch (bằng cách thêm từng cây mới trong chuỗi sao cho những gì bị mất bởi cây trước đó bị bắt), nhưng cũng có phương sai (bằng cách kết hợp nhiều mô hình).
Vì vậy, Boosting giảm lỗi trên cả hai mặt trận, trong khi RF chỉ có thể giảm lỗi thông qua việc giảm phương sai. Tất nhiên, như tôi đã nói, có thể có những lời giải thích khác cho hiệu suất tốt hơn của Boosting được quan sát trong thực tế. Ví dụ, trang 591 của cuốn sách nói trên, người ta nói rằng Boosting vượt trội hơn RF về vấn đề hình cầu lồng nhau bởi vì trong trường hợp cụ thể đó, ranh giới quyết định thực sự là phụ gia . (?) Họ cũng báo cáo rằng Boosting làm tốt hơn RF đối với thư rác và dữ liệu nhà ở California.
Một tài liệu tham khảo khác cho thấy Boosting vượt trội hơn RF là Caruana và Niculescu-Mizil 2006 . Thật không may, họ báo cáo kết quả nhưng không cố gắng giải thích nguyên nhân gây ra chúng. Họ đã so sánh hai phân loại (và nhiều hơn nữa) về 11 vấn đề phân loại nhị phân cho 8 số liệu hiệu suất khác nhau.
Như bayerj đã nói, không có cách nào để biết một tiên nghiệm!
Rừng ngẫu nhiên tương đối dễ hiệu chỉnh: các tham số mặc định của hầu hết các triển khai (R hoặc Python, mỗi ví dụ) đạt được kết quả tuyệt vời.
Mặt khác, GBM rất khó điều chỉnh (số lượng cây quá lớn dẫn đến quá mức, độ sâu tối đa là rất quan trọng, tốc độ học tập và số lượng cây hoạt động cùng nhau ...) và lâu hơn để đào tạo (việc triển khai đa luồng là khan hiếm) . Một điều chỉnh được thực hiện lỏng lẻo có thể dẫn đến hiệu suất thấp.
Tuy nhiên, từ kinh nghiệm của tôi, nếu bạn dành đủ thời gian cho GBM, bạn có khả năng đạt được hiệu suất tốt hơn so với rừng ngẫu nhiên.
A loosely performed tuning may lead to dramatic performance?
Coi chừng giải thích sai, bởi vì trong tiếng Anh dramatic
có nghĩa là rất tốt, đặc biệt, phi thường, vv! Tôi đoán đó là điều trái ngược với những gì bạn muốn nói ... Ngoài ra, bạn có lời giải thích nào về lý do tại sao các GBM được điều chỉnh cẩn thận vượt trội hơn RF không? Về cơ bản đây là câu hỏi ...