Các phương pháp nghệ thuật để tìm các phần không có nghĩa của một chuỗi thời gian


9

Tôi có chuỗi thời gian ồn ào mà tôi cần phân đoạn thành các phần đó với giá trị trung bình bằng 0 và các phần đó không có giá trị trung bình bằng không. Tìm ranh giới càng chính xác càng tốt là điều quan trọng (rõ ràng ranh giới nằm chính xác là một chút chủ quan). Tôi nghĩ rằng một biến thể cusum có thể được điều chỉnh để làm điều này nhưng vì cusum chủ yếu là tìm kiếm những thay đổi duy nhất khiến toàn bộ chiến lược phân khúc hoàn toàn không bị ảnh hưởng.

Tôi chắc rằng một loạt các nghiên cứu đã được thực hiện về vấn đề này nhưng không thể tìm thấy nó.

PS Lượng dữ liệu trong chuỗi thời gian này khá lớn, tức là lên tới hàng trăm triệu mẫu và một mẫu riêng lẻ có thể là một vectơ với vài trăm thành phần, vì vậy một phương pháp có thể được tính toán hợp lý nhanh chóng là một yếu tố quan trọng .

PPS Không có thẻ phân đoạn, do đó thẻ phân loại.

Câu trả lời:


1

Dường như vấn đề chính ở đây là phát hiện điểm thay đổi hiệu quả, vì sau đó, giá trị trung bình của phân khúc có thể được tìm thấy một cách tầm thường với độ chính xác ngày càng tăng về số lượng mẫu. Một khi cách tiếp cận gần đây có thể thú vị là Z. Harchaoui, F. Bach và E. Moulines. Phân tích điểm thay đổi hạt nhân, Những tiến bộ trong Hệ thống xử lý thông tin thần kinh (NIPS), 2008.


1

Điều này có thể không phải là nghệ thuật, nhưng một phương pháp trực quan sẽ làm mịn dữ liệu bằng cách đặt các trọng số lên các quan sát gần với từng thời điểm. Vì vậy, nếu bạn muốn biết liệu mẫu R có trung bình không tại thời điểm T:

mu(R,T)=w1*Sample(R,T)+w2*Sample(R,T-1)+w3*Sample(R,T+1)....

Có lẽ trọng số mũ có thể là một lựa chọn tốt, tùy thuộc vào định nghĩa của nơi đóng quân.

Sau khi quan tâm đến một số chi tiết kỹ thuật như định nghĩa ở đầu và cuối của mỗi somple, giờ đây bạn có thể kiểm tra xem mỗi mu có đủ gần bằng 0 để tìm các điểm trong đó giá trị trung bình bằng không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.