Gần đây tôi đã bắt gặp một số nguồn "không chính thức" chỉ ra rằng trong một số trường hợp, nếu chúng tôi sử dụng AIC hoặc BIC để đào tạo mô hình chuỗi thời gian, chúng tôi không cần chia dữ liệu thành thử nghiệm và đào tạo - chúng tôi có thể sử dụng tất cả các dữ liệu cho đào tạo. (Các nguồn bao gồm những người khác, một cuộc thảo luận về bài đăng trên blog của Rob Hyndman trên CV , bài trình bày này từ Stanford hoặc Phần 4 của văn bản này ).
Cụ thể, dường như chúng chỉ ra rằng AIC hoặc BIC có thể được sử dụng khi tập dữ liệu quá nhỏ để cho phép phân tách thử nghiệm / đào tạo.
Ví dụ, nhận xét của Rob Hyndman: "Sử dụng AIC / BIC sẽ hiệu quả hơn nhiều khi sử dụng các bộ kiểm tra hoặc CV, và nó trở nên cần thiết cho chuỗi thời gian ngắn khi không có đủ dữ liệu để làm khác."
Tuy nhiên, tôi dường như không thể tìm thấy bất kỳ văn bản hoặc giấy tờ nào thảo luận chi tiết về vấn đề này.
Một điều đặc biệt làm tôi bối rối là AIC và BIC có xu hướng bất thường về việc xác thực chéo, điều đó có nghĩa là nếu có thể, họ sẽ thay thế CV cho các tập dữ liệu lớn - đi ngược lại ý tưởng của chúng là hữu ích cho các tập dữ liệu nhỏ.
Bất cứ ai có thể chỉ cho tôi một cuộc thảo luận chính thức (chương sách, bài báo, hướng dẫn) về ý tưởng này?