Làm thế nào để tôi gán thêm trọng lượng cho các quan sát gần đây hơn trong R?
Tôi cho rằng đây là một câu hỏi hoặc mong muốn thường gặp nhưng tôi có một thời gian khó khăn để tìm ra chính xác làm thế nào để thực hiện điều này. Tôi đã cố gắng tìm kiếm rất nhiều cho điều này nhưng tôi không thể tìm thấy một ví dụ thực tế tốt.
Trong ví dụ của tôi, tôi sẽ có một bộ dữ liệu lớn theo thời gian. Tôi muốn nói áp dụng một số loại trọng số theo cấp số nhân của các hàng dữ liệu gần đây hơn. Vì vậy, tôi sẽ có một số loại hàm số mũ cho biết các quan sát trong năm 2015 là ___ quan trọng hơn để đào tạo mô hình so với các quan sát trong năm 2012.
Các biến số liệu của tôi chứa hỗn hợp các giá trị phân loại và số và mục tiêu của tôi là một giá trị số - nếu điều đó quan trọng.
Tôi muốn kiểm tra / dùng thử điều này bằng cách sử dụng các mô hình như GBM / Rừng ngẫu nhiên, lý tưởng nhất là trong gói CARET.
cập nhật câu hỏi
Tôi đánh giá cao phản hồi được đưa ra dưới đây về cách giảm trọng lượng theo cấp số nhân theo khoảng cách ngày giữa hai điểm.
Tuy nhiên, khi nói đến việc đào tạo mô hình này trong caret, làm thế nào chính xác các yếu tố trọng lượng trong? Giá trị trọng lượng trong mỗi hàng đào tạo là khoảng cách giữa một số điểm trong tương lai và khi điểm đó trong lịch sử xảy ra.
Các trọng lượng chỉ có tác dụng trong dự đoán? Bởi vì nếu họ tham gia vào khóa đào tạo, liệu điều đó có gây ra đủ loại vấn đề vì các nếp gấp khác nhau sẽ có trọng lượng khác nhau, cố gắng dự đoán điều gì đó có thể thực sự xảy ra tại thời điểm trước đó không?