Tôi thậm chí không chắc chắn rằng câu hỏi có ý nghĩa nhiều, nhưng tôi nghĩ rằng tôi đã thấy một vài tiêu đề của bài báo nơi họ đề xuất rừng ngẫu nhiên với các hiệu ứng ngẫu nhiên. Điều này có thể trong R?
Tôi thậm chí không chắc chắn rằng câu hỏi có ý nghĩa nhiều, nhưng tôi nghĩ rằng tôi đã thấy một vài tiêu đề của bài báo nơi họ đề xuất rừng ngẫu nhiên với các hiệu ứng ngẫu nhiên. Điều này có thể trong R?
Câu trả lời:
Chúng không được sử dụng phổ biến cùng nhau, và cần cẩn thận trước khi kết hợp chúng.
Rừng ngẫu nhiên thường được sử dụng làm phân loại. Lý do bạn sẽ sử dụng một khu rừng ngẫu nhiên thay vì một phương thức khác (ví dụ: phân cụm K-nghĩa là) bạn có thể có một số lượng lớn kích thước mà bạn muốn phân loại theo. Vấn đề với việc có số lượng kích thước lớn là nếu bạn muốn kiểm tra tất cả các kết hợp của thứ tự kích thước, bạn sẽ có một số lượng lớn các lựa chọn (nó tăng nhanh hơn số lượng yếu tố kích thước).
Hiệu ứng ngẫu nhiên thường được sử dụng trong hồi quy với các biện pháp lặp đi lặp lại của cùng một điều. Chúng thường được sử dụng trong các mô hình hiệu ứng hỗn hợp trong đó thuật ngữ hỗn hợp đề cập đến cả hiệu ứng cố định và ngẫu nhiên. Các hiệu ứng cố định được cho là đại diện cho các thông số mà bạn sẽ thấy lại (ví dụ: thuốc hoặc tuổi của một người). Các hiệu ứng ngẫu nhiên được cho là đại diện cho một trường hợp biến đổi xung quanh một tham số mà bạn sẽ không gặp lại (ví dụ: một người cụ thể).
Có các ví dụ sử dụng chúng cùng nhau khi có dữ liệu được phân cụm http://dx.doi.org/10.1080/00949655.2012.741599 và http://www2.ims.nus.edu.sg/Programs/014sw class / files / denis.pdf .
Tôi không biết về bất kỳ gói R nào có thể thực hiện phân tích này.
Vâng, điều đó là có thể. Bạn nên xem " Cây RE-EM: Cách tiếp cận khai thác dữ liệu cho dữ liệu theo chiều dọc và cụm", và gói R liên quan REEMtree .
Lâu lắm rồi tôi mới nhìn vào tờ giấy. Tôi nhớ rằng các tác giả chưa thử tạo thành các nhóm cây này, nhưng không có gì cho thấy nó không hoạt động.
Hiệu ứng hỗn hợp Rừng ngẫu nhiên (MERFs) là một điều. Như câu trả lời ở trên, có một số nghiên cứu tuyệt vời về chúng bởi nhóm của Tiến sĩ Larocque tại HEC Montreal. Bài viết ở đây: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Về cơ bản, đây là một cách hợp lý về mặt lý thuyết để kết hợp mô hình phi tuyến tính của các khu rừng ngẫu nhiên với các hiệu ứng ngẫu nhiên tuyến tính.
Chúng tôi vừa phát hành một gói nguồn mở trong Python triển khai MERF bằng thuật toán trên trong bài báo.
Chúng tôi đã viết một bài đăng blog chi tiết về gói và cách sử dụng nó cho các tập dữ liệu được nhóm.