Làm thế nào để rừng ngẫu nhiên tạo ra rừng ngẫu nhiên


20

Tôi không phải là chuyên gia về rừng ngẫu nhiên nhưng tôi hiểu rõ rằng vấn đề chính của rừng ngẫu nhiên là việc tạo cây (ngẫu nhiên). Bạn có thể giải thích cho tôi làm thế nào cây được tạo ra? (tức là phân phối được sử dụng để tạo cây là gì?)

Cảm ơn trước !

Câu trả lời:


16

Triển khai RF khác nhau một chút. Tôi biết rằng việc triển khai độc quyền của Salford Systems được cho là tốt hơn so với vanilla trong R. Một mô tả về thuật toán được viết bằng tiếng Anh của Friedman-Hastie-Tibshirani, tái bản lần 2, in lần thứ 3 . Toàn bộ một chương (thứ 15) được dành cho RF, và tôi thấy nó thực sự rõ ràng hơn so với bài báo gốc. Thuật toán xây dựng cây được trình bày chi tiết trên p.588; không cần tôi phải sao chép nó ở đây, vì cuốn sách có sẵn trực tuyến.


Cảm ơn rất nhiều cho câu trả lời của bạn ! Tôi đã đọc cuốn sách này từ trang đầu đến trang cuối, nhưng tôi nghĩ đó là phiên bản 1 ... Tôi không biết nó có sẵn trực tuyến.
cướp girard

19

Ý tưởng chính là thủ tục đóng bao, không làm cây ngẫu nhiên. Cụ thể, mỗi cây được xây dựng trên một mẫu các đối tượng được vẽ thay thế từ bộ ban đầu; do đó, mỗi cây có một số đối tượng mà nó chưa từng thấy, đó là điều làm cho toàn bộ quần thể trở nên không đồng nhất hơn và do đó tốt hơn trong việc khái quát hóa.

Hơn nữa, cây đang bị suy yếu theo cách mà trên mỗi phần tách chỉ có mtrycác thuộc tính được chọn ngẫu nhiên M (hoặc ) được xem xét; M thường là căn bậc hai của số lượng thuộc tính trong tập hợp. Điều này đảm bảo rằng các cây được cung cấp quá ít, vì chúng không được cắt tỉa. Bạn có thể tìm thêm chi tiết ở đây .

Mặt khác, có một biến thể của RF được gọi là Extreme Random Forest, trong đó cây được tạo ra một cách ngẫu nhiên (không có tối ưu hóa phân chia) - tham khảo, tôi nghĩ rằng tài liệu tham khảo này .


Xin lỗi, tôi không thực sự hiểu câu trả lời của bạn. Ý bạn là gì khi nói "Chi tiết, mỗi cây được xây dựng trên một mẫu các đối tượng được vẽ thay thế từ bộ ban đầu" Bạn có thể đưa ra độ chính xác cao hơn về nơi tôi tìm thấy chi tiết "ở đây" không?
cướp girard

1
Đây là cách đóng bao hoạt động; kiểm tra en.wikipedia.org/wiki/Bootstrap_aggregating . Đây là một liên kết (hầu như không nhìn thấy trong chủ đề mà tôi thừa nhận) với tài liệu tham khảo RF chi tiết.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.