khi tôi bước vào dự báo với các mô hình ARIMA, tôi đang cố gắng hiểu làm thế nào tôi có thể cải thiện dự báo dựa trên sự phù hợp với ARIMA với tính thời vụ và độ trôi.
Dữ liệu của tôi là chuỗi thời gian tiếp theo (hơn 3 năm, với xu hướng rõ ràng lên và tính thời vụ rõ ràng, dường như không được hỗ trợ bởi tự động tương quan ở độ trễ 12, 24, 36 ??).
> bal2sum3years.ts
Jan Feb Mar Apr May Jun Jul Aug
2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729
2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888
2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416
Sep Oct Nov Dec
2010 2232261 2394644 2468479 2816287
2011 2480940 2699780 2760268 3206372
2012 2951516 3119176 3032960 3738256
Mô hình được đề xuất bởi auto.arima(bal2sum3years.ts)
đã cho tôi mô hình sau:
Series: bal2sum3years.ts
ARIMA(0,0,0)(0,1,0)[12] with drift
Coefficients:
drift
31725.567
s.e. 2651.693
sigma^2 estimated as 2.43e+10: log likelihood=-321.02
AIC=646.04 AICc=646.61 BIC=648.39
Tuy nhiên, acf(bal2sum3years.ts,max.lag=35)
hệ số acf không hiển thị cao hơn 0,3. Tuy nhiên, tính thời vụ của dữ liệu là khá rõ ràng - tăng đột biến vào đầu mỗi năm. Đây là những gì loạt bài trông giống như trên biểu đồ:
Dự báo sử dụng fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE)
, được gọi theo chức năng forecast(fit)
, dẫn đến kết quả trong 12 tháng tiếp theo có nghĩa là bằng 12 tháng cuối cùng của dữ liệu cộng với hằng số. Điều này có thể được nhìn thấy bằng cách gọi plot(forecast(fit))
,
Tôi cũng đã kiểm tra các phần dư, không tương thích nhưng có giá trị trung bình dương (khác không).
Sự phù hợp không mô hình chính xác chuỗi thời gian ban đầu, theo ý kiến của tôi (màu xanh là chuỗi thời gian ban đầu, màu đỏ là fitted(fit)
:
Các khách mời là, mô hình không chính xác? Tui bỏ lỡ điều gì vậy? Làm thế nào tôi có thể cải thiện mô hình? Có vẻ như mô hình thực sự mất 12 tháng qua và thêm một hằng số để đạt được 12 tháng tiếp theo.
Tôi là người mới bắt đầu tương đối trong các mô hình dự báo và thống kê chuỗi thời gian.