Dự đoán dữ liệu đếm với rừng ngẫu nhiên


12

Một khu rừng ngẫu nhiên có thể được đào tạo để dự đoán một cách thích hợp dữ liệu đếm? Làm thế nào điều này sẽ tiến hành? Tôi có khá nhiều giá trị để phân loại không thực sự có ý nghĩa. Nếu tôi sử dụng hồi quy, tôi chỉ cần cắt bớt kết quả? Tôi khá lạc lối ở đây. Có ý kiến ​​gì không?


1
bạn không thể sử dụng hồi quy poisson?
RJ-

Tôi muốn sử dụng một cái gì đó không tham số. Đừng thực sự nhớ các giả định hồi quy poisson nhưng tôi khá chắc chắn một trong số đó là các quan sát là độc lập và điều đó không được thực hiện sâu sắc ở đây. Điều này có thể ảnh hưởng đến tôi nhiều?
JEquihua

2
Bạn đã thử thực hiện hồi quy RF (có thể cả trong nhật ký) chưa? Nó có thể chỉ hoạt động đủ tốt.

1
Không có. Nhưng đó là bản năng đầu tiên của tôi. Đăng nhập hoặc chuyển đổi căn bậc hai. Nhưng tôi muốn xem có ai có kinh nghiệm về việc này không.
JEquihua

Tôi đã thử chỉ thực hiện hồi quy trên phản hồi, nhật ký (phản hồi) và sqrt (phản hồi) và không có gì tốt. Tôi nghĩ vấn đề là nhiều hơn các biến độc lập của tôi đã giải thích phản hồi. Ồ tốt
JEquihua

Câu trả lời:


8

Có một gói R được gọi là mobForestcó thể phù hợp với một khu rừng ngẫu nhiên thực sự cho dữ liệu đếm. Nó dựa trên mod()(phân vùng đệ quy dựa trên mô hình) trong partygói. Nó thực hiện hồi quy Poisson nếu familyđối số được chỉ định là poisson(). Gói không còn trong kho CRAN, nhưng các phiên bản có sẵn trước đây có thể được lấy từ kho lưu trữ.

Nếu bạn không bị giới hạn trong rừng / đóng bao ngẫu nhiên, một phiên bản tăng cường cũng có sẵn cho dữ liệu đếm. Đó là, gbm(mô hình hồi quy tăng cường tổng quát). Nó cũng có thể phù hợp với một mô hình Poisson.


4

Tôi thấy một vài khả năng.

  • Bạn có thể chuyển phản hồi thành một vài loại tùy ý và sử dụng cây phân loại
  • Nếu số đếm thường rất thấp, 0, 0, 0, 1, 0, 3, 0, 2, bạn có thể coi mỗi số nguyên là một lớp và lại sử dụng cây phân loại (có thể không phải là trường hợp của bạn). Trong những trường hợp này, sẽ khó hơn để có được số liệu loại giải thích phương sai cao thay vì hồi quy liên tục.
  • Nếu số lượng thường không thấp và có nhiều biến thể, tôi chỉ cần sử dụng nó với cây hồi quy. Ví dụ, sử dụng hồi quy poisson so với hồi quy tuyến tính, chỉ hấp dẫn khi có được một công cụ dự báo tuyến tính tốt. Nếu bạn không thấy khả năng dự đoán tốt với rừng ngẫu nhiên, thì tôi nghi ngờ một mô hình fancier có thể cung cấp dữ liệu đếm cụ thể sẽ giúp ích rất nhiều cho bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.