Rừng ngẫu nhiên cực kỳ khác với rừng ngẫu nhiên như thế nào?


18

Là ER thực hiện hiệu quả hơn (giống như Extreme Gradient Boostinglà tăng cường độ dốc) - sự khác biệt quan trọng từ quan điểm thực tế? Có gói R thực hiện chúng. Đây có phải là thuật toán mới vượt qua việc thực hiện "chung chung" (gói RandomForest từ R) không chỉ về mặt hiệu quả hay còn ở một số lĩnh vực khác không?

Rừng ngẫu nhiên cực lớn http://link.springer.com/article/10.1007%2Fs10994-006-6226-1

Câu trả lời:


20

Điều này khá đơn giản - RF tối ưu hóa việc phân chia trên cây (tức là chọn những người cung cấp thông tin tốt nhất liên quan đến quyết định) và ERF làm cho chúng ngẫu nhiên. Hiện nay,

  • chi phí tối ưu hóa (không nhiều, nhưng vẫn còn), vì vậy ERF thường nhanh hơn.
  • tối ưu hóa có thể đóng góp vào mối tương quan của cây trong toàn bộ hoặc quá mức tổng thể, do đó ERF có thể mạnh hơn, đặc biệt là nếu tín hiệu yếu.

Đi xa hơn nữa theo hướng này, bạn có thể tăng thêm tốc độ bằng cách cân bằng các phần tách trên mỗi cấp độ cây, cách này chuyển đổi cây thành dương xỉ , cũng khá thú vị; có R thực hiện R của tôi của một cá nhân như vậy.


Liên kết đó bị hỏng, hãy sử dụng CVLAB: Ferns
smci

Tôi cho rằng các cây do ERF tạo ra lớn hơn nhiều so với RF, bởi vì RF sử dụng tối ưu hóa để nén kiến ​​thức từ tập dữ liệu lên các cây nhỏ hơn
Qbik
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.