Tôi có một chuỗi thời gian hàng ngày khá dễ đoán với tính thời vụ hàng tuần. Tôi có thể đưa ra các dự đoán có vẻ khá chính xác (được xác nhận bằng xác nhận chéo) khi không có ngày nghỉ. Tuy nhiên, khi có ngày lễ, tôi có các vấn đề sau:
- Tôi nhận được các số khác không cho các ngày lễ trong dự báo của mình, mặc dù tất cả các ngày lễ lịch sử đều bằng 0. Đây thực sự không phải là vấn đề chính. Vấn đề là...
- Vì việc xử lý không xảy ra vào các ngày lễ "tràn ra" cho đến những ngày sau ngày lễ, một biến giả đơn giản không cắt giảm, vì các ngoại lệ này dường như là đổi mới ngắn hạn. Nếu không có tính thời vụ hàng tuần, có lẽ tôi có thể đưa ra ước tính phân phối dữ liệu chưa được xử lý vào ngày nghỉ trong năm ngày sau kỳ nghỉ (như được đề xuất trong Cách bạn tạo các biến phản ánh mức độ ảnh hưởng của độ trễ và độ trễ của ngày lễ / hiệu ứng lịch trong một phân tích chuỗi thời gian? ). Tuy nhiên, việc phân phối "tràn" tùy thuộc vào ngày trong tuần xảy ra, và ngày lễ là Giáng sinh hay Lễ Tạ ơn, nơi các đơn đặt hàng được đặt ở mức thấp hơn so với phần còn lại của năm.
Dưới đây là một vài ảnh chụp nhanh từ xác thực chéo của tôi cho thấy kết quả dự đoán (màu xanh) so với kết quả thực tế (màu đỏ) cho các ngày lễ xuất hiện vào các ngày khác nhau trong tuần:
Tôi cũng lo lắng rằng tác động của Giáng sinh phụ thuộc vào ngày trong tuần và tôi chỉ có sáu năm dữ liệu lịch sử.
Có ai có bất kỳ đề xuất cho làm thế nào để đối phó với các loại ngoại lệ đổi mới trong bối cảnh dự báo? (Thật không may, tôi không thể chia sẻ bất kỳ dữ liệu nào)