Rừng ngẫu nhiên với dữ liệu theo chiều dọc


7

Tôi có nhiều phép đo cho nhiều cá nhân, nhưng tôi không chắc làm thế nào để tính toán cấu trúc đo lặp lại đó khi chạy mô hình rừng ngẫu nhiên.

Có cách nào để tính toán cấu trúc dữ liệu cơ bản của dữ liệu theo chiều dọc bằng mô hình rừng ngẫu nhiên không?

Điều này thậm chí còn cần thiết? - dường như với tôi rằng nó nên ...

Tôi đặc biệt muốn có thể thực hiện điều này trong R.


Lưu ý: Tôi giữ điều này ngắn gọn và đơn giản để xem liệu cuối cùng tôi có thể thu hút một số câu trả lời cho một câu hỏi không. Nếu ai đó muốn biết thêm thông tin hoặc mở rộng câu hỏi này, vui lòng bình luận so với bỏ phiếu. Một lần nữa, nó không ngắn do thiếu nghiên cứu trước đó, nhưng vì tôi muốn mọi người thực sự phản hồi về nó ...: p
bác sĩ lâm sàng

Bạn có thể giải thích mục tiêu của bạn là gì với phân tích này?
Dimitriy V. Masterov

Mục tiêu của tôi là sản xuất một mô hình dự đoán. mô hình sẽ dự đoán chiều cao của cây từ đường kính cây, dựa vào vị trí của loài và cây. Mỗi cây được lấy mẫu nhiều lần trong nhiều thập kỷ, do đó các phép đo được nhóm lại trong các cá nhân.
bác sĩ lâm sàng

2
Tại sao cứ khăng khăng sử dụng rừng ngẫu nhiên với chuỗi thời gian? Có một tài liệu sâu sắc trong các số liệu thống kê về nhiều lần cắt ngang trong chuỗi thời gian, chưa kể vô số phương pháp hiện có để mô hình hóa và dự đoán chuỗi thời gian. Sử dụng RF bỏ qua lịch sử đó trong khi, thực tế, xây dựng lại nó bằng một công cụ blunter. Chỉ vì bạn có một cái búa (RF), không phải mọi thứ đều là đinh.
Mike Hunter

1
Ok ... tài liệu về nhiều thuật ngữ có thể bắt đầu với cuốn sách xuất sắc của Little và Rubin, Phân tích thống kê với dữ liệu bị thiếu. Ở đó, họ phát triển các khái niệm kinh điển về MAR, MCAR, v.v. Gần đây, cuốn sách Sage rất dễ đọc của Paul Allison, Nhiều tranh luận về dữ liệu bị mất có một đánh giá tốt về tài liệu trong suốt thời gian nó xuất hiện. Gần đây, các phương pháp dự đoán chuỗi thời gian và thiếu giá trị của Sorjana được khuyến nghị nhưng tôi không quen với nó.
Mike Hunter

Câu trả lời:


3

Có một bài viết trước đó đã thảo luận bao gồm các hiệu ứng hỗn hợp cho dữ liệu theo cụm / theo chiều dọc.

Làm cách nào tôi có thể đưa các hiệu ứng ngẫu nhiên vào một RandomForest

Dưới đây là một tài liệu tham khảo tốt cho việc triển khai cây quyết định trong R: http://statistic-research.com/a-brief-tour-of-the-trees-and-forests/

Ngoài ra, bạn có thể muốn xem lại các slide này http://www2.ims.nus.edu.sg/Programs/014swgroup/files/denis.pdf


1

Bạn có thể thử các gói sau trong R:

  • REEMtree : không phải là rừng ngẫu nhiên mà là một mô hình cây đơn lẻ trong đó sự khác biệt giữa các đối tượng được tính theo thời gian (được gọi là hiệu ứng ngẫu nhiên hoặc hỗn hợp) và một số cây có thể được tạo thành, hoặc

  • glmertree : giống như các cách tiếp cận có thể giải thích cho các phương tiện không đổi theo phân khúc - có thể được điều chỉnh để giải thích cho các mô hình tăng trưởng cụ thể riêng lẻ (xem tại đây ).

Hoặc bạn chỉ đơn giản đặt tuổi là một biến trong mô hình của mình để chiếm ít nhất bit đó của đặc tính cây riêng lẻ?


1
Bạn có thể đặt thêm một số xác thịt vào điều này như thể các liên kết đã chết, câu trả lời sẽ không còn hữu ích.
mdewey

cũng có giấy tờ về các gói: REEMtree ( springerlink.com/content/ng44781g47736260 ) và glmertree ( econauge.repec.org/apers/innwapers/2015-10.htm )
nils
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.