Cách kiểm tra xem quy trình tạo chuỗi thời gian có thay đổi theo thời gian không


7

Vấn đề

Tôi có dữ liệu chuỗi thời gian được tạo bởi một máy trong hai khoảng thời gian rời rạc - khoảng một tháng vào năm 2016 và một tháng khác vào năm 2018.

Các chuyên gia tên miền đưa ra giả thuyết rằng tại mỗi thời điểm bước , một biến quan sát có thể được giải thích bằng một tập hợp các biến quan sát khác, .tYtX1t,Giáo dục,Xdt

Làm thế nào tôi có thể kiểm tra xem quá trình này đã thay đổi theo thời gian? Lưu ý rằng tôi không thử kiểm tra xem phân phối cho biến có thay đổi theo thời gian không. Tôi muốn kiểm tra xem mối quan hệ giữa có thay đổi theo thời gian không.YXTôiY

Phương cách hiện hành

Giả sử tôi phù hợp với mô hình chuỗi thời gian (ví dụ: Quy trình Gaussian) trên dữ liệu từ năm 2016 để dự đoán đưa ra như một cách để mô hình hóa quy trình cơ bản đã tạo ra .YtX1t,Giáo dục,XdtYt

Các chuyên gia lĩnh vực đã gợi ý rằng có lẽ chúng ta có thể cố gắng sử dụng mô hình này để dự đoán các biến s trao s từ năm 2018 và sử dụng các phần dư bằng cách nào đó để suy luận rằng mô hình (đại diện cho quá trình vào năm 2016) là hoặc là không còn như vậy trong năm 2018. Tôi không chắc chắn làm thế nào để tiếp tục sau thời điểm này.YtXt

Những gì tôi đang xem xét

  1. Tôi có nên kiểm tra nếu dư lượng từ năm 2016 và 2018 được tạo ra từ cùng một phân phối hay thực hiện kiểm tra mức độ phù hợp bằng cách sử dụng một cái gì đó như kiểm tra Kolmogorov-Smirnov? Mối quan tâm của tôi với phương pháp này là dữ liệu ngoài mẫu từ năm 2018 có thể có lỗi lớn hơn dữ liệu đào tạo trong mẫu từ năm 2016, do đó, thử nghiệm này có thể sẽ dẫn đến kết quả dương tính giả. Có cách nào để điều chỉnh / tài khoản cho hiệu ứng này?

  2. Tôi có nên phù hợp với hai mô hình, một cho năm 2016 và một cho năm 2018 và sử dụng một số cách để kiểm tra xem hai mô hình này là "giống nhau" hay "khác nhau" không? Ví dụ, một khả năng là tính toán độ phân kỳ KL giữa 2 Quy trình Gaussian được trang bị tương ứng trên dữ liệu năm 2016 và 2018. Có bất kỳ đề xuất hoặc vấn đề khác với phương pháp này?

  3. Tôi thấy một số bài viết về sự hợp nhất. Nhưng tôi không hoàn toàn hiểu khái niệm này. Điều này có liên quan không?

Nói chung, làm thế nào một người có thể tiếp cận loại vấn đề này? Tôi đã thử tìm kiếm trực tuyến này, nhưng có thể do sự thiếu chính xác của truy vấn của tôi (tôi không quen thuộc trong lĩnh vực này), tôi không nhận được nhiều kết quả có liên quan. Tôi đánh giá cao ngay cả những gợi ý / nhận xét đơn giản về (các) chủ đề / từ khóa để tìm kiếm, hoặc sách / giấy để xem qua.

Vui lòng lưu ý rằng tôi đang tìm kiếm các phương pháp tiếp cận nguyên tắc (tốt nhất là thống kê) và không phải là phương pháp dựa trên phương pháp phỏng đoán. Ví dụ điển hình là các câu trả lời gợi ý kiểm tra Chow và các biến thể của nó dưới đây.


3
Bạn có thể muốn xem xét Phát hiện điểm thay đổi (xem thêm đánh giá gần đây ).
qeschaton

@qeschaton Cảm ơn. Quét nhanh tài liệu và tra cứu thuật ngữ trên Google cho thấy thuật toán phát hiện điểm thay đổi phát hiện khi một chuỗi đã thay đổi. Tôi thực sự hy vọng tìm ra một cách để phát hiện khi mối quan hệ giữa đầu vào và đầu ra tạo ra đầu ra đã thay đổi. Tôi sẽ xem xét kỹ hơn về bài báo và hy vọng sẽ có những biến thể phù hợp với vấn đề hiện tại của tôi. Cảm ơn bạn.
hóa học ánh sáng

Câu trả lời:


2

Thay đổi cấu trúc có thể được kiểm tra không chỉ với thử nghiệm Chow được đề cập bởi @John Stax Jakobsen.

Có rất nhiều bài kiểm tra khác, đặc biệt là các bài kiểm tra dao động thường hoạt động tốt.

Ở đây bạn có giới thiệu tốt đẹp về Rgói strucchangetính toán chúng. Nếu bạn không phải là Rngười dùng, chỉ đọc lý thuyết, nó được mô tả tốt ở đó.


Cảm ơn bạn! Các tài liệu tham khảo và từ khóa "kiểm tra biến động" là rất hữu ích. Bây giờ tôi có một cái tên chính xác hơn để tìm kiếm khi tôi thực hiện khảo sát văn học của mình.
hóa học ánh sáng

1

Nếu nó hợp lý để mô hình hóa mối quan hệ với hồi quy tuyến tính, thì một cách dễ dàng để kiểm tra phá vỡ cấu trúc là kiểm tra chow.

xem bài viết wiki tại đây


1

Một trong những tính năng mà tôi đưa vào gói dự báo yêu thích của mình là Thử nghiệm CHOW để điều tra điểm dừng đó trong các tham số có ý nghĩa nhất. Trước khi tôi làm điều đó tôi phải điều trị / điều chỉnh xung / xung theo mùa.

Tất nhiên, nếu có các mức dịch chuyển xác định hoặc Xu hướng thời gian, bài kiểm tra này được bỏ qua.

Thử nghiệm CHOW có các lỗi độc lập với mỗi nhóm vì nó được yêu cầu trong thử nghiệm F mà anh ta sử dụng.

Việc triển khai của tôi bao gồm khả năng các nguyên nhân người dùng hiện tại và / hoặc bị trì hoãn trong GLM.


0

Đầu tiên, tôi sẽ chỉ phù hợp với một số mô hình hộp đen (ví dụ GBM hoặc rừng ngẫu nhiên) trực tiếp tính đến biến thời gian T, ví dụ Yt= =F(Xt1,Giáo dục,Xdt;T). Nó có thể hữu ích để kiểm tra mức độ chi tiết khác nhau củaT, chẳng hạn như được đo bằng năm dương lịch (2016, 2018), tháng trôi qua kể từ năm 2016, v.v ... Sau đó, để đánh giá tầm quan trọng của Tngười ta có thể nhìn vào các ô quan trọng khác nhau (xem ví dụ Mục Phần 15.3.2 Tầm quan trọng biến đổi trong các yếu tố của học thống kê ) hoặc đơn giản là bỏTbiến, chỉnh lại mô hình và so sánh hiệu suất của mô hình.

Ngoài ra, bạn có thể bám sát mô hình của mình (quy trình Gaussian) và so sánh các phần dư năm 2016 và 2018. Tôi đồng ý với trực giác của bạn rằng việc so sánh phân phối dư trong mẫu (2016) và ngoài mẫu (2018) sẽ nhận được kết quả sai lệch. Tuy nhiên, điều này có thể được khắc phục nhanh chóng bằng cách phân vùng dữ liệu của bạn như sau: chia dữ liệu năm 2016 thành tập hợp con đào tạo (được sử dụng để phù hợp với mô hình) và tập hợp xác thực (được sử dụng để đánh giá chất lượng mô hình của bạn), cũng xác định tập dữ liệu xác thực thứ hai bằng tập hợp con của Dữ liệu năm 2018. Sau đó, chỉ cần điều chỉnh mô hình của bạn bằng cách sử dụng tập hợp con đào tạo và kiểm tra hiệu suất (tính toán phần dư, MSE, v.v.) trên hai tập hợp con xác thực (2016 và 2018). Để loại trừ cơ hội (kết quả của bạn có thể khác nhau chỉ vì không may mắn), bạn có thể muốn lặp lại toàn bộ bài tập (chia dữ liệu, mô hình phù hợp,

Ngoài ra, như bạn đã đề cập, bạn có thể phù hợp với hai mô hình khác nhau (một mô hình dựa trên dữ liệu năm 2016, mô hình khác chỉ dựa trên dữ liệu năm 2018). Trong trường hợp này, tôi cũng sẽ chia dữ liệu cho mỗi năm thành các tập con xác thực và xác thực và đánh giá hiệu suất mô hình dựa trên các tập con xác thực. Để đo lường mức độ tương tự bạn có thể sử dụng: RMSE, QQ-lô, kiểm tra thống kê mà bạn đã đề cập hoặc tính toán khoảng tin cậy cho các dự đoán đến từ cả hai mô hình và kiểm tra xem liệu khoảng tin cậy có trùng nhau hay không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.