Như @Christopher Lauden đã đề cập ở trên, phân tích chuỗi thời gian là thích hợp nhất cho loại điều này. Tuy nhiên, nếu bạn muốn thực hiện một "phương pháp học máy" truyền thống hơn, thì điều mà tôi đã làm trong quá khứ là chặn dữ liệu của bạn thành các cửa sổ thời gian chồng chéo như các tính năng, sau đó sử dụng nó để dự đoán những ngày tiếp theo (hoặc tuần ) giao thông.
Ma trận tính năng của bạn sẽ giống như:
t1 | t2 | ... | tN
t2 | t3 | ... | tN+1
t3 | t4 | ... | tN+2
...
tW | tW+1 | ... |tN+W
nơi tI
là giao thông trên ngày I
. Tính năng bạn sẽ dự đoán là lưu lượng truy cập vào ngày sau cột cuối cùng. Về bản chất, sử dụng cửa sổ giao thông để dự đoán lưu lượng truy cập vào ngày hôm sau.
Bất kỳ loại mô hình ML sẽ làm việc cho điều này.
Biên tập
Để trả lời câu hỏi, "bạn có thể giải thích cách bạn sử dụng ma trận tính năng này không":
Ma trận tính năng có các giá trị biểu thị lưu lượng truy cập trong quá khứ trong một khoảng thời gian (ví dụ: lưu lượng truy cập hàng giờ trong 1 tuần) và chúng tôi sử dụng điều này để dự đoán lưu lượng truy cập trong một khoảng thời gian được chỉ định trong tương lai. Chúng tôi lấy dữ liệu lịch sử của mình và xây dựng một ma trận tính năng của lưu lượng truy cập lịch sử và gắn nhãn này với lưu lượng truy cập vào một khoảng thời gian nào đó trong tương lai (ví dụ: 2 ngày sau cửa sổ trong tính năng). Sử dụng một số mô hình học máy hồi quy, chúng ta có thể lấy dữ liệu lưu lượng truy cập lịch sử và thử và xây dựng một mô hình có thể dự đoán lưu lượng di chuyển trong bộ dữ liệu lịch sử của chúng ta. Giả định là giao thông trong tương lai sẽ giống với giao thông trong quá khứ.