Tôi đã cố gắng hiểu cách biểu diễn và định hình dữ liệu để đưa ra dự báo chuỗi thời gian đa chiều và đa biến bằng cách sử dụng Keras (hoặc TensorFlow) nhưng tôi vẫn không rõ sau khi đọc nhiều bài đăng / hướng dẫn / tài liệu blog về cách trình bày dữ liệu trong hình dạng chính xác (hầu hết các ví dụ là hơi ít
Bộ dữ liệu của tôi:
- một số thành phố
- mà tôi có thông tin về nhiệt độ, lưu lượng xe, độ ẩm
- giả sử trong 2 năm qua (một kỷ lục cho mỗi ngày)
Những gì tôi muốn làm: Tôi muốn dự báo cho mỗi thành phố nhiệt độ tôi có thể mong đợi cho năm tới bằng cách sử dụng một phiên bản có thể bị trễ về nhiệt độ, giao thông xe hơi và độ ẩm (tất nhiên sẽ có nhiều tính năng hơn nhưng đây chỉ là một tính năng ví dụ cho suy nghĩ).
Điều tôi bối rối về: Nếu tôi có 2 thành phố, tôi đã ghi lại 3 tính năng trong 365 ngày. Tôi nên định hình đầu vào của mình như thế nào để mô hình có thể xuất dự báo trong 365 ngày cho hai thành phố này (tức là chuỗi nhiệt độ 2 lần trong 365 ngày)?
Theo trực giác hình dạng tenor sẽ là (?, 365, 3)
trong 365 ngày và 3 tính năng. Nhưng tôi không chắc chắn những gì sẽ dính vào chiều thứ nhất và quan trọng nhất, tôi sẽ ngạc nhiên nếu nó phải dành cho số lượng thành phố. Nhưng đồng thời, tôi không biết làm thế nào để xác định vào mô hình mà nó phải hiểu đúng kích thước.
Bất kỳ con trỏ sẽ hữu ích. Tôi khá quen thuộc với phần còn lại của vấn đề (tức là cách bạn xây dựng một mạng trong Keras, v.v. vì tôi đã làm điều này cho các mạng thần kinh khác nhưng cụ thể hơn là cách mã hóa chuỗi cho đầu vào mong muốn tốt nhất.)
Ồ và cũng vậy , tôi đoán rằng tôi có thể đào tạo và dự đoán cho từng thành phố một cách độc lập, nhưng tôi chắc chắn mọi người sẽ đồng ý có những điều có thể học được không phải là đặc biệt đối với bất kỳ thành phố nào nhưng chỉ có thể được nhìn thấy nếu xem xét một vài trong số chúng, do đó tôi nghĩ điều quan trọng là phải mã hóa nó trong mô hình.