Cách Rừng ngẫu nhiên được xây dựng là bất biến đối với các phép biến đổi đơn điệu của các biến độc lập. Chia tách sẽ hoàn toàn tương tự. Nếu bạn chỉ nhắm đến sự chính xác, bạn sẽ không thấy bất kỳ cải thiện nào trong đó. Trên thực tế, vì Rừng ngẫu nhiên có thể tìm thấy các mối quan hệ phi tuyến tính phức tạp (Tại sao bạn gọi đây là hồi quy tuyến tính?) Và các tương tác biến đổi nhanh chóng, nếu bạn chuyển đổi các biến độc lập của mình, bạn có thể làm mịn thông tin cho phép thuật toán này thực hiện Điều này đúng.
Đôi khi Rừng ngẫu nhiên không được coi là hộp đen và được sử dụng để suy luận. Ví dụ: bạn có thể diễn giải các biện pháp quan trọng của biến mà nó cung cấp hoặc tính toán một số loại hiệu ứng cận biên của biến độc lập trên biến phụ thuộc của bạn. Điều này thường được hình dung như các ô phụ thuộc một phần. Tôi khá chắc chắn rằng điều cuối cùng này bị ảnh hưởng rất nhiều bởi quy mô của các biến, đây là một vấn đề khi cố gắng thu thập thông tin có tính mô tả hơn từ Rừng ngẫu nhiên. Trong trường hợp này, nó có thể giúp bạn chuyển đổi các biến của bạn (tiêu chuẩn hóa), điều này có thể làm cho các ô phụ thuộc một phần có thể so sánh được. Không hoàn toàn chắc chắn về điều này, sẽ phải suy nghĩ về nó.
Cách đây không lâu, tôi đã cố gắng dự đoán dữ liệu đếm bằng cách sử dụng Rừng ngẫu nhiên, hồi quy trên căn bậc hai và nhật ký tự nhiên của biến phụ thuộc đã giúp một chút, không nhiều và không đủ để tôi giữ mô hình.
Một số gói mà bạn có thể sử dụng rừng ngẫu nhiên để suy luận:
https://uc-r.github.io/lime
https://cran.r-project.org/web/packages/randomForestExplainer/index.html
https://pbiecek.github.io/DALEX_docs/2-2-useCaseApartmetns.html