Câu hỏi: Tôi muốn chắc chắn về điều gì đó, việc sử dụng xác thực chéo k-Fold với chuỗi thời gian có đơn giản không, hay người ta cần phải đặc biệt chú ý trước khi sử dụng nó?
Bối cảnh: Tôi đang lập mô hình chuỗi thời gian 6 năm (với chuỗi semi-markov), với mẫu dữ liệu cứ sau 5 phút. Để so sánh một số mô hình, tôi đang sử dụng xác thực chéo 6 lần bằng cách tách dữ liệu trong 6 năm, vì vậy các bộ đào tạo của tôi (để tính toán các tham số) có độ dài 5 năm và các bộ thử nghiệm có độ dài 1 năm. Tôi không tính đến thứ tự thời gian, vì vậy các bộ khác nhau của tôi là:
- gấp 1: đào tạo [1 2 3 4 5], kiểm tra [6]
- gấp 2: đào tạo [1 2 3 4 6], kiểm tra [5]
- gấp 3: đào tạo [1 2 3 5 6], kiểm tra [4]
- gấp 4: đào tạo [1 2 4 5 6], kiểm tra [3]
- gấp 5: đào tạo [1 3 4 5 6], kiểm tra [2]
- gấp 6: đào tạo [2 3 4 5 6], kiểm tra [1].
Tôi đang đưa ra giả thuyết rằng mỗi năm độc lập với nhau. Làm thế nào tôi có thể xác minh điều đó? Có tài liệu tham khảo nào cho thấy khả năng áp dụng xác nhận chéo k-lần với chuỗi thời gian.