Tôi có một bộ sưu tập lớn về chuỗi thời gian - các phép đo được thực hiện cứ sau 15 phút (96 lần đo trong một ngày) trong khoảng thời gian 1 năm tại nhiều địa điểm khác nhau.
Tôi đã chia mỗi chuỗi thời gian thành 365 chuỗi thời gian nhỏ hơn, 1 cho mỗi ngày trong năm. Nhìn vào chuỗi thời gian này, chắc chắn có nhiều hình dạng riêng biệt cho một ngày. Một số trông hình sin, một số là không đổi, một số trông giống như một quá trình ngẫu nhiên ngẫu nhiên, một số trông parabol và một số trông giống như của U.
Những gì tôi muốn làm là sử dụng một thuật toán có thể tìm thấy những hình dạng phổ biến này. Tôi đã nghĩ về việc phân cụm và sử dụng các cụm sao để xác định các hình dạng phổ biến, nhưng muốn kiểm tra với cộng đồng nếu điều này đúng. Cho đến nay, tôi đã xem Dynamic Time Warp như một số liệu, nhưng có vẻ như số liệu đó đòi hỏi rất nhiều tính toán. Tôi cũng đã tìm thấy
http://mox.polimi.it/it/progetti/pubblicazioni/quaderni/13-2008.pdf từ SE.
Tôi cũng đã thấy Có thể thực hiện phân cụm chuỗi thời gian dựa trên hình dạng đường cong không? nhưng câu hỏi này là từ năm 2010 và có thể đã lỗi thời.
Một ý tưởng khác mà tôi có là thực hiện các phép ma trận được định dạng như sau:
Ma trận là một ma trận của tất cả các chuỗi thời gian được quan sát vào ngày i . Mỗi hàng của ma trận M i là một chuỗi thời gian có độ dài 96. Sau đó, tôi sẽ thực hiện 365 lần xuất tinh và sử dụng các hàm riêng như các hình dạng phổ biến. Điều này nghe có vẻ hợp lý?
Cảm ơn!