Không có triệu chứng, tối thiểu hóa AIC tương đương với giảm thiểu MSE xác thực chéo một lần cho dữ liệu cắt ngang [ 1 ]. Vậy khi chúng ta có AIC, tại sao một người lại sử dụng phương pháp phân chia dữ liệu thành các tập huấn luyện, xác nhận và kiểm tra để đo các thuộc tính dự đoán của các mô hình? Những lợi ích cụ thể của thực hành này là gì?
Tôi có thể nghĩ ra một lý do: nếu người ta muốn đánh giá hiệu suất dự đoán của các mô hình, phân tích ngoài mẫu là hữu ích. Nhưng mặc dù AIC không phải là thước đo độ chính xác của dự báo , người ta thường có ý tưởng tốt nếu một mô hình nào đó đạt được tiềm năng tối đa (đối với dữ liệu được đưa ra) về mức độ bạn sẽ có thể dự đoán.