Tôi quan tâm đến việc lựa chọn mô hình trong một thiết lập chuỗi thời gian. Để cụ thể, giả sử tôi muốn chọn một mô hình ARMA từ một nhóm các mô hình ARMA với các đơn đặt hàng độ trễ khác nhau. Mục đích cuối cùng là dự báo .
Lựa chọn mô hình có thể được thực hiện bởi
- xác nhận chéo,
- sử dụng các tiêu chí thông tin (AIC, BIC),
trong số các phương pháp khác.
Rob J. Hyndman cung cấp một cách để xác nhận chéo cho chuỗi thời gian . Đối với các mẫu tương đối nhỏ, cỡ mẫu được sử dụng trong xác nhận chéo có thể khác về chất so với cỡ mẫu ban đầu. Ví dụ: nếu kích thước mẫu ban đầu là 200 quan sát, thì người ta có thể nghĩ đến việc bắt đầu xác thực chéo bằng cách thực hiện 101 quan sát đầu tiên và mở rộng cửa sổ lên 102, 103, ..., 200 quan sát để có được 100 kết quả xác thực chéo. Rõ ràng, một mô hình có khả năng phân tích hợp lý cho 200 quan sát có thể quá lớn cho 100 quan sát và do đó, lỗi xác thực của nó sẽ lớn. Do đó, xác nhận chéo có khả năng ủng hộ một cách có hệ thống các mô hình quá phức tạp. Đây là một hiệu ứng không mong muốn do sự không phù hợp trong kích thước mẫu .
Một thay thế cho xác nhận chéo là sử dụng tiêu chí thông tin để lựa chọn mô hình. Vì tôi quan tâm đến dự báo, tôi sẽ sử dụng AIC. Mặc dù AIC tương đương với việc giảm thiểu MSE dự báo một bước mẫu cho các mô hình chuỗi thời gian (theo bài đăng này của Rob J. Hyndman), tôi nghi ngờ điều này có liên quan ở đây vì mẫu kích thước tôi quan tâm không lớn ...
Câu hỏi: tôi có nên chọn AIC theo thời gian xác thực chéo cho các mẫu nhỏ / vừa không?
Một vài câu hỏi liên quan có thể được tìm thấy ở đây , đây và đây .