Có nên tránh cắt tỉa để đóng bao (với cây quyết định)?


8

Tôi đã đến một số bài viết và giấy tờ tuyên bố rằng việc cắt tỉa cây trong một nhóm "đóng bao" cây là không cần thiết (xem 1 ).

Tuy nhiên, có nhất thiết (hoặc ít nhất là trong một số trường hợp đã biết) có hại khi thực hiện cắt tỉa (giả sử, với mẫu OOB) trên các cây riêng lẻ trong một nhóm không?

Cảm ơn!

Câu trả lời:


6

Tài năng

Nói chung, cắt tỉa sẽ làm giảm hiệu suất của cây đóng gói.

Tress là phân loại không ổn định; có nghĩa là nếu bạn làm xáo trộn dữ liệu một chút thì cây có thể thay đổi đáng kể. Họ là những mô hình sai lệch thấp nhưng phương sai cao. Đóng bao thường hoạt động bằng cách "sao chép" mô hình để giảm phương sai xuống (thủ thuật "tăng kích thước mẫu" cũ của bạn).

Tuy nhiên, nếu bạn kết thúc các mô hình trung bình rất giống nhau, thì bạn không thu được nhiều. Nếu những cái cây không được cắt tỉa, chúng có xu hướng khác biệt với nhau hơn là khi chúng được cắt tỉa. Điều này có tác dụng "giải mã" các cây để bạn lấy trung bình các cây không quá giống nhau. Đây cũng là lý do mà các khu rừng ngẫu nhiên thêm vào các điều chỉnh bổ sung của lựa chọn dự đoán ngẫu nhiên. Điều đó buộc các cây trở nên rất khác nhau.

Sử dụng cây chưa được xử lý sẽ làm tăng nguy cơ bị thừa, nhưng mô hình trung bình nhiều hơn so với việc bù đắp điều này (nói chung).

HTH

Tối đa


Cảm ơn Max, câu trả lời của bạn vừa hữu ích vừa sâu sắc. Bạn, Tal
Tal Galili
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.