Bất cứ ai có thể giải thích sự khác biệt giữa RandomForestClassifier và ExtraTreesClassifier trong scikit học. Tôi đã dành một chút thời gian để đọc bài báo:
P. Geurts, D. Ernst., Và L. Wehenkel, “Cây cực kỳ ngẫu nhiên”, Machine Learning, 63 (1), 3-42, 2006
Có vẻ như đây là sự khác biệt đối với ET:
1) Khi chọn các biến tại một lần tách, các mẫu được lấy từ toàn bộ tập huấn luyện thay vì một mẫu bootstrap của tập huấn luyện.
2) Các phần tách được chọn hoàn toàn ngẫu nhiên từ phạm vi giá trị trong mẫu tại mỗi lần tách.
Kết quả từ hai việc này là nhiều "lá" hơn.