Tôi có một chuỗi thời gian tôi đang cố gắng dự báo, trong đó tôi đã sử dụng mô hình ARIMA theo mùa (0,0,0) (0,1,0) [12] (= fit2). Nó khác với những gì R đề xuất với auto.arima (R tính ARIMA (0,1,1) (0,1,0) [12] sẽ phù hợp hơn, tôi đặt tên cho nó là fit1). Tuy nhiên, trong 12 tháng cuối của chuỗi thời gian của tôi, mô hình của tôi (fit2) dường như phù hợp hơn khi được điều chỉnh (nó bị sai lệch thường xuyên, tôi đã thêm giá trị trung bình còn lại và sự phù hợp mới dường như nằm gọn hơn trong chuỗi thời gian ban đầu Dưới đây là ví dụ về 12 tháng qua và MAPE trong 12 tháng gần đây nhất cho cả hai sự phù hợp:
Chuỗi thời gian trông như thế này:
Càng xa càng tốt. Tôi đã thực hiện phân tích dư cho cả hai mô hình, và đây là sự nhầm lẫn.
Acf (Resid (fit1)) trông rất tuyệt, rất trắng-noisey:
Tuy nhiên, ví dụ, bài kiểm tra Ljung-Box có vẻ không tốt cho 20 lần trễ:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
Tôi nhận được kết quả sau:
X-squared = 26.8511, df = 19, p-value = 0.1082
Theo hiểu biết của tôi, đây là sự xác nhận rằng phần dư không độc lập (giá trị p quá lớn để tồn tại với Giả thuyết Độc lập).
Tuy nhiên, đối với độ trễ 1, mọi thứ đều tuyệt vời:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
cho tôi kết quả:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
Hoặc là tôi không hiểu bài kiểm tra, hoặc nó hơi mâu thuẫn với những gì tôi thấy trên cốt truyện acf. Sự tự kỷ là cười thấp.
Sau đó tôi kiểm tra fit2. Hàm autocorrelation trông như thế này:
Mặc dù tự động tương quan rõ ràng như vậy ở một số độ trễ đầu tiên, thử nghiệm Ljung-Box cho tôi kết quả tốt hơn nhiều ở 20 độ trễ, so với fit1:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
kết quả trong :
X-squared = 147.4062, df = 20, p-value < 2.2e-16
trong khi chỉ kiểm tra tự động tương quan ở lag1, cũng cho tôi xác nhận giả thuyết khống!
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
Tôi có hiểu bài kiểm tra một cách chính xác không? Giá trị p nên được ưu tiên nhỏ hơn 0,05 để xác nhận giả thuyết khống về tính độc lập của phần dư. Sự phù hợp nào là tốt hơn để sử dụng để dự báo, fit1 hoặc fit2?
Thông tin bổ sung: phần dư của fit1 hiển thị phân phối bình thường, những phần còn lại của fit2 thì không.
X-squared
) trở nên lớn hơn khi các tương quan tự động mẫu của phần dư trở nên lớn hơn (xem định nghĩa của nó), và giá trị p của nó là xác suất nhận được giá trị lớn hơn hoặc lớn hơn giá trị quan sát được dưới giá trị null giả thuyết rằng những đổi mới thực sự là độc lập. Do đó, giá trị p nhỏ là bằng chứng chống lại sự độc lập.
fitdf
) để bạn kiểm tra phân phối chi bình phương với độ tự do bằng không.