Tôi ấn tượng bởi forecast
gói R , cũng như zoo
gói cho chuỗi thời gian không đều và nội suy các giá trị bị thiếu.
Ứng dụng của tôi nằm trong lĩnh vực dự báo lưu lượng trung tâm cuộc gọi, vì vậy dữ liệu vào cuối tuần (hầu như) luôn bị thiếu, có thể được xử lý độc đáo zoo
. Ngoài ra, một số điểm riêng biệt có thể bị thiếu, tôi chỉ sử dụng R NA
cho điều đó.
Vấn đề là: tất cả các phép thuật tốt đẹp của gói dự báo, chẳng hạn như eta()
, auto.arima()
v.v., dường như mong đợi ts
các đối tượng đơn giản , tức là chuỗi thời gian không thể thay thế không chứa bất kỳ dữ liệu bị thiếu. Tôi nghĩ rằng các ứng dụng trong thế giới thực cho chuỗi thời gian chỉ có thể thay thế chắc chắn là tồn tại, nhưng - theo ý kiến của tôi - rất hạn chế.
Vấn đề của một vài NA
giá trị riêng biệt có thể dễ dàng được giải quyết bằng cách sử dụng bất kỳ hàm nội suy nào được cung cấp zoo
cũng như bởi forecast::interp
. Sau đó, tôi chạy dự báo.
Những câu hỏi của tôi:
- Có ai đề xuất một giải pháp tốt hơn?
(câu hỏi chính của tôi) Ít nhất là trong miền ứng dụng của tôi, dự báo lưu lượng truy cập trung tâm cuộc gọi (và theo như tôi có thể tưởng tượng hầu hết các miền có vấn đề khác), chuỗi thời gian không bị thay thế. Ít nhất chúng tôi có chương trình "ngày làm việc" định kỳ hoặc một cái gì đó. Cách tốt nhất để xử lý điều đó và vẫn sử dụng tất cả các phép thuật hay của gói dự báo là gì?
Tôi có nên "nén" chuỗi thời gian để lấp đầy các ngày cuối tuần, thực hiện dự báo và sau đó "thổi phồng" dữ liệu một lần nữa để chèn lại các giá trị NA vào cuối tuần không? (Tôi nghĩ đó sẽ là một sự xấu hổ?)
Có kế hoạch nào để làm cho gói dự báo tương thích hoàn toàn với các gói chuỗi thời gian bất thường như sở thú hay không? Nếu có, khi nào và nếu không, tại sao không?
Tôi còn khá mới với dự báo (và thống kê nói chung), vì vậy tôi có thể bỏ qua điều gì đó quan trọng.
auto.arima
có thể xử lý các giá trị còn thiếu.