Vấn đề mà tôi đang giải quyết là dự đoán các giá trị chuỗi thời gian. Tôi đang xem xét một chuỗi thời gian một lần và dựa trên 15% dữ liệu đầu vào, tôi muốn dự đoán các giá trị trong tương lai của nó. Cho đến nay tôi đã bắt gặp hai mô hình:
- LSTM (bộ nhớ ngắn hạn; một lớp các mạng thần kinh tái phát)
- ARIMA
Tôi đã thử cả hai và đọc một số bài viết về chúng. Bây giờ tôi đang cố gắng để có được một cảm giác tốt hơn về cách so sánh hai. Những gì tôi đã tìm thấy cho đến nay:
- LSTM hoạt động tốt hơn nếu chúng ta xử lý lượng dữ liệu khổng lồ và có đủ dữ liệu đào tạo, trong khi ARIMA tốt hơn cho các bộ dữ liệu nhỏ hơn (điều này có đúng không?)
- ARIMA yêu cầu một loạt các tham số
(p,q,d)
phải được tính toán dựa trên dữ liệu, trong khi LSTM không yêu cầu thiết lập các tham số đó. Tuy nhiên, có một số siêu âm chúng ta cần điều chỉnh cho LSTM. - EDIT: Một điểm khác biệt lớn giữa hai điều mà tôi nhận thấy khi đọc một bài viết tuyệt vời ở đây , đó là ARIMA chỉ có thể hoạt động tốt trên chuỗi thời gian đứng yên (nơi không có tính thời vụ, xu hướng và v.v.) và bạn cần quan tâm đến điều đó nếu muốn sử dụng ARIMA
Ngoài các thuộc tính được đề cập ở trên, tôi không thể tìm thấy bất kỳ điểm hoặc sự kiện nào khác có thể giúp tôi hướng tới việc chọn mô hình tốt nhất. Tôi sẽ thực sự biết ơn nếu ai đó có thể giúp tôi tìm các bài báo, giấy tờ hoặc các thứ khác (cho đến nay không có may mắn, chỉ có một số ý kiến chung ở đây và ở đó và không có gì dựa trên các thí nghiệm.)
Tôi phải đề cập rằng ban đầu tôi đang xử lý dữ liệu phát trực tuyến, tuy nhiên hiện tại tôi đang sử dụng bộ dữ liệu NAB bao gồm 50 bộ dữ liệu với kích thước tối đa 20k điểm dữ liệu.