Tôi có một biến liên tục, được lấy mẫu trong khoảng thời gian một năm tại các khoảng thời gian không đều. Một số ngày có nhiều hơn một quan sát mỗi giờ, trong khi các giai đoạn khác không có gì trong nhiều ngày. Điều này khiến việc phát hiện các mẫu trong chuỗi thời gian trở nên đặc biệt khó khăn, bởi vì một số tháng (ví dụ tháng 10) được lấy mẫu cao, trong khi các mẫu khác thì không.
Câu hỏi của tôi là cách tiếp cận tốt nhất để mô hình chuỗi thời gian này là gì?
- Tôi tin rằng hầu hết các kỹ thuật phân tích chuỗi thời gian (như ARMA) cần một tần số cố định. Tôi có thể tổng hợp dữ liệu, để có một mẫu không đổi hoặc chọn một tập hợp con của dữ liệu rất chi tiết. Với cả hai tùy chọn, tôi sẽ thiếu một số thông tin từ bộ dữ liệu ban đầu, có thể tiết lộ các mẫu riêng biệt.
- Thay vì phân tách chuỗi theo chu kỳ, tôi có thể cung cấp mô hình với toàn bộ tập dữ liệu và hy vọng nó sẽ nhận được các mẫu. Chẳng hạn, tôi đã chuyển đổi giờ, ngày trong tuần và tháng theo các biến phân loại và thử hồi quy bội với kết quả tốt (R2 = 0,71)
Tôi có ý tưởng rằng các kỹ thuật học máy như ANN cũng có thể chọn các mẫu này từ chuỗi thời gian không đồng đều, nhưng tôi tự hỏi liệu có ai đã thử nó chưa, và có thể cung cấp cho tôi một lời khuyên về cách biểu diễn các mẫu thời gian tốt nhất trong mạng Thần kinh.