Vấn đề
Tôi có dữ liệu chuỗi thời gian được tạo bởi một máy trong hai khoảng thời gian rời rạc - khoảng một tháng vào năm 2016 và một tháng khác vào năm 2018.
Các chuyên gia tên miền đưa ra giả thuyết rằng tại mỗi thời điểm bước , một biến quan sát có thể được giải thích bằng một tập hợp các biến quan sát khác, .
Làm thế nào tôi có thể kiểm tra xem quá trình này đã thay đổi theo thời gian? Lưu ý rằng tôi không thử kiểm tra xem phân phối cho biến có thay đổi theo thời gian không. Tôi muốn kiểm tra xem mối quan hệ giữa và có thay đổi theo thời gian không.
Phương cách hiện hành
Giả sử tôi phù hợp với mô hình chuỗi thời gian (ví dụ: Quy trình Gaussian) trên dữ liệu từ năm 2016 để dự đoán đưa ra như một cách để mô hình hóa quy trình cơ bản đã tạo ra .
Các chuyên gia lĩnh vực đã gợi ý rằng có lẽ chúng ta có thể cố gắng sử dụng mô hình này để dự đoán các biến s trao s từ năm 2018 và sử dụng các phần dư bằng cách nào đó để suy luận rằng mô hình (đại diện cho quá trình vào năm 2016) là hoặc là không còn như vậy trong năm 2018. Tôi không chắc chắn làm thế nào để tiếp tục sau thời điểm này.
Những gì tôi đang xem xét
Tôi có nên kiểm tra nếu dư lượng từ năm 2016 và 2018 được tạo ra từ cùng một phân phối hay thực hiện kiểm tra mức độ phù hợp bằng cách sử dụng một cái gì đó như kiểm tra Kolmogorov-Smirnov? Mối quan tâm của tôi với phương pháp này là dữ liệu ngoài mẫu từ năm 2018 có thể có lỗi lớn hơn dữ liệu đào tạo trong mẫu từ năm 2016, do đó, thử nghiệm này có thể sẽ dẫn đến kết quả dương tính giả. Có cách nào để điều chỉnh / tài khoản cho hiệu ứng này?
Tôi có nên phù hợp với hai mô hình, một cho năm 2016 và một cho năm 2018 và sử dụng một số cách để kiểm tra xem hai mô hình này là "giống nhau" hay "khác nhau" không? Ví dụ, một khả năng là tính toán độ phân kỳ KL giữa 2 Quy trình Gaussian được trang bị tương ứng trên dữ liệu năm 2016 và 2018. Có bất kỳ đề xuất hoặc vấn đề khác với phương pháp này?
Tôi thấy một số bài viết về sự hợp nhất. Nhưng tôi không hoàn toàn hiểu khái niệm này. Điều này có liên quan không?
Nói chung, làm thế nào một người có thể tiếp cận loại vấn đề này? Tôi đã thử tìm kiếm trực tuyến này, nhưng có thể do sự thiếu chính xác của truy vấn của tôi (tôi không quen thuộc trong lĩnh vực này), tôi không nhận được nhiều kết quả có liên quan. Tôi đánh giá cao ngay cả những gợi ý / nhận xét đơn giản về (các) chủ đề / từ khóa để tìm kiếm, hoặc sách / giấy để xem qua.
Vui lòng lưu ý rằng tôi đang tìm kiếm các phương pháp tiếp cận nguyên tắc (tốt nhất là thống kê) và không phải là phương pháp dựa trên phương pháp phỏng đoán. Ví dụ điển hình là các câu trả lời gợi ý kiểm tra Chow và các biến thể của nó dưới đây.