Tôi đã có hai chuỗi thời gian (tham số của một mô hình dành cho nam và nữ) và nhằm xác định một mô hình ARIMA phù hợp để đưa ra dự báo. Chuỗi thời gian của tôi trông như sau:
Cốt truyện và ACF cho thấy không cố định (các gai của ACF bị cắt rất chậm). Vì vậy, tôi sử dụng sự khác biệt và thu được:
Cốt truyện này chỉ ra rằng loạt phim hiện có thể đứng yên và việc áp dụng thử nghiệm kpss và thử nghiệm adf hỗ trợ cho giả thuyết này.
Bắt đầu với loạt Nam, chúng tôi thực hiện các quan sát sau:
- Sự tự tương quan theo kinh nghiệm tại Lags 1,4,5,26 và 27 khác biệt đáng kể so với số không.
- ACF cắt (?), Nhưng tôi lo ngại về các đột biến tương đối lớn ở độ trễ 26 và 27.
- Chỉ có tự động tương quan một phần theo kinh nghiệm tại Lags 1 và 2 là khác biệt đáng kể so với không.
Dựa trên những quan sát này, nếu tôi phải chọn một mô hình AR hoặc MA thuần túy cho chuỗi thời gian khác biệt, tôi sẽ có xu hướng chọn một mô hình AR (2) bằng cách lập luận rằng:
- Chúng tôi không có tự động tương quan một phần đáng kể cho độ trễ lớn hơn 2
- ACF bị cắt ngoại trừ khu vực xung quanh độ trễ 27. (Có phải một vài ngoại lệ này chỉ là một chỉ báo, rằng một mô hình ARMA hỗn hợp sẽ phù hợp?)
hoặc một mô hình MA (1) bằng cách lập luận rằng:
- PACF rõ ràng cắt đứt
- Chúng tôi có độ trễ lớn hơn 1 chỉ 4 gai vượt quá giá trị tới hạn về độ lớn. Đây là "chỉ" một hơn 3 gai (95% trong số 60) sẽ được phép nằm bên ngoài khu vực chấm.
Không có đặc điểm của mô hình ARIMA (1,1,1) và việc chọn thứ tự p và q của mô hình ARIMA với lý do ACF và PACF cho p + q> 2 trở nên khó khăn.
Sử dụng auto.arima () với tiêu chí AIC (Tôi nên sử dụng AIC hay AICC?) Mang lại:
- ARIMA (2,1,1) với Độ lệch; AIC = 280,2783
- ARIMA (0,1,1) với Độ lệch; AIC = 280,2784
- ARIMA (2,1,0) với Độ lệch; AIC = 281,437
Tất cả ba mô hình được xem xét cho thấy dư lượng tiếng ồn trắng:
Câu hỏi tóm tắt của tôi là:
- Bạn vẫn có thể mô tả ACF của chuỗi thời gian là cắt giảm mặc dù các xung đột xung quanh độ trễ 26?
- Những điều này có phải là một chỉ số cho thấy một mô hình ARMA hỗn hợp có thể phù hợp hơn không?
- Tôi nên chọn tiêu chí thông tin nào? AIC? AICC?
- Phần dư của ba mô hình có AIC cao nhất đều thể hiện hành vi nhiễu trắng, nhưng sự khác biệt trong AIC chỉ rất nhỏ. Tôi có nên sử dụng thông số có ít tham số nhất, ví dụ ARIMA (0,1,1) không?
- Lập luận của tôi nói chung có hợp lý không?
- Là những khả năng xa hơn của họ để xác định mô hình nào có thể tốt hơn hay tôi nên lấy ví dụ, hai mô hình có AIC cao nhất và thực hiện các cuộc kiểm tra ngược để kiểm tra tính hợp lý của các dự báo?
EDIT: Đây là dữ liệu của tôi:
-5.9112948202 -5.3429985122 -4.7382340534 -3.1129015623 -3.0350910288 -2.3218904871 -1.7926701792 -1.1417358384 -0.6665592055 -0.2907748318 0.2899480865 0.4637205370 0.5826312749 0.3869227286 0.6268379174 0.7439125292 0.7641139207 0.7613140511 3.0143912244 -0.7339255839 2.0109976796 0.8282394650 -2.5668367983 5.9826406394 1.9569198553 2.3860893476 2.0883339390 1.9761894580 2.2601997245 2.2464027995 2.5131158613 3.4564765529 4.2307335557 4.0298688374 3.7626317439 3.1026407174 2.1690168737 1.5617407254 2.6790460788 0.4652054768 -0.0501046517 -1.0157683791 -0.5113698054 -0.0180401353 -1.9471272198 -0.2550365250 -1.1269988523 0.5152074134 0.2362626753 -2.9978337017 1.4924705528 -1.4907767844 -0.5492041416 -0.7313021018 -0.6531515868 -0.4094159299 -0.5525401626 -0.0611454515 -0.5256272882 -1.1235247363 -1.7299848758 -1.3807763611 -1.6999054476 -4.3155973110 -4.7843298990