Một khu rừng ngẫu nhiên là một tập hợp các cây quyết định được hình thành bằng cách chỉ chọn ngẫu nhiên một số tính năng nhất định để xây dựng mỗi cây với (và đôi khi đóng gói dữ liệu đào tạo). Rõ ràng họ học và khái quát tốt. Có ai đã thực hiện lấy mẫu MCMC của không gian cây quyết định hoặc so sánh chúng với các khu rừng ngẫu nhiên chưa? Tôi biết có thể tốn kém hơn khi chạy MCMC và lưu tất cả các cây được lấy mẫu, nhưng tôi quan tâm đến các tính năng lý thuyết của mô hình này, chứ không phải chi phí tính toán. Ý tôi là một cái gì đó như thế này:
- Xây dựng một cây quyết định ngẫu nhiên (Nó có thể sẽ thực hiện khủng khiếp)
- Khả năng tính toán của cây với một cái gì đó giống như , hoặc có lẽ thêm một P p r i o r ( T r e e ) kỳ hạn.
- Chọn một bước ngẫu nhiên để thay đổi cây và chọn dựa trên khả năng .
- Mỗi N bước, lưu một bản sao của cây hiện tại
- Quay trở lại 3 cho một số lần N * M lớn
- Sử dụng bộ sưu tập cây M đã lưu để dự đoán
Điều này sẽ cung cấp một hiệu suất tương tự như Rừng ngẫu nhiên? Lưu ý rằng ở đây chúng tôi không vứt bỏ dữ liệu hay tính năng tốt ở bất kỳ bước nào không giống như các khu rừng ngẫu nhiên.