Tôi có một mô hình dự báo cho một chuỗi thời gian và tôi muốn tính toán lỗi dự đoán ngoài mẫu của nó. Hiện tại, chiến lược tôi đang theo là chiến lược được đề xuất trên blog của Rob Hyndman (gần cuối trang) diễn ra như thế này (giả sử chuỗi thời gian và tập huấn luyện có kích thước ) k
- mô hình với dữ liệu và để là dự báo cho lần quan sát tiếp theo.y t + k
- Tính toán lỗi dự báo là .
- Lặp lại cho
- Tính sai số bình phương trung bình là
Câu hỏi của tôi là tôi phải lo lắng bao nhiêu về mối tương quan vì các bộ huấn luyện chồng chéo của tôi. Cụ thể, giả sử tôi muốn dự báo không chỉ giá trị tiếp theo, mà cả các giá trị tiếp theo , để tôi có dự đoán và các lỗi và tôi muốn xây dựng một cấu trúc thuật ngữ của các lỗi dự đoán.
Tôi vẫn có thể cuộn cửa sổ của khóa đào tạo được chuyển tiếp 1 lần mỗi lần, hay tôi nên cuộn nó về phía trước bằng ? Làm thế nào để câu trả lời cho những câu hỏi này thay đổi nếu có sự tự tương quan đáng kể trong chuỗi mà tôi dự đoán (có thể hiểu đó là một quá trình bộ nhớ dài, tức là chức năng tự tương quan phân rã như một định luật lũy thừa chứ không phải theo cấp số nhân.)
Tôi đánh giá cao một lời giải thích ở đây hoặc liên kết đến một nơi nào đó nơi tôi có thể tìm thấy kết quả lý thuyết về khoảng tin cậy xung quanh MSE (hoặc các biện pháp lỗi khác).