Dự đoán chuỗi thời gian bằng ARIMA vs LSTM


9

Vấn đề mà tôi đang giải quyết là dự đoán các giá trị chuỗi thời gian. Tôi đang xem xét một chuỗi thời gian một lần và dựa trên 15% dữ liệu đầu vào, tôi muốn dự đoán các giá trị trong tương lai của nó. Cho đến nay tôi đã bắt gặp hai mô hình:

  • LSTM (bộ nhớ ngắn hạn; một lớp các mạng thần kinh tái phát)
  • ARIMA

Tôi đã thử cả hai và đọc một số bài viết về chúng. Bây giờ tôi đang cố gắng để có được một cảm giác tốt hơn về cách so sánh hai. Những gì tôi đã tìm thấy cho đến nay:

  1. LSTM hoạt động tốt hơn nếu chúng ta xử lý lượng dữ liệu khổng lồ và có đủ dữ liệu đào tạo, trong khi ARIMA tốt hơn cho các bộ dữ liệu nhỏ hơn (điều này có đúng không?)
  2. ARIMA yêu cầu một loạt các tham số (p,q,d)phải được tính toán dựa trên dữ liệu, trong khi LSTM không yêu cầu thiết lập các tham số đó. Tuy nhiên, có một số siêu âm chúng ta cần điều chỉnh cho LSTM.

Khác với các thuộc tính được đề cập ở trên, tôi không thể tìm thấy bất kỳ điểm hoặc sự kiện nào khác có thể giúp tôi hướng tới việc chọn mô hình tốt nhất. Tôi sẽ thực sự biết ơn nếu ai đó có thể giúp tôi tìm các bài báo, giấy tờ hoặc các thứ khác (cho đến nay không có may mắn, chỉ có một số ý kiến ​​chung ở đây và ở đó và không có gì dựa trên các thí nghiệm.)

Tôi phải đề cập rằng ban đầu tôi đang xử lý dữ liệu phát trực tuyến, tuy nhiên hiện tại tôi đang sử dụng bộ dữ liệu NAB bao gồm 50 bộ dữ liệu với kích thước tối đa 20k điểm dữ liệu.


1
Tại sao bạn không thử hai mô hình trên một phần dữ liệu của mình, xem mô hình nào tốt hơn trong dự báo và chọn nó. Hoặc sử dụng cả hai mô hình và kết hợp dự báo của họ. Kết hợp dự báo thường tốt hơn các dự báo cá nhân.
Richard Hardy

@RichardHardy Tôi đã thực hiện điều đó và nhận thức được hiệu suất của chúng trên bộ dữ liệu của tôi. Tôi đang cố gắng để hiểu rõ hơn về cả hai, đặc biệt là nhược điểm của họ để xem ai có thể là ứng cử viên tốt nhất để xử lý các mẫu dữ liệu sắp tới.
ahajib


Vui lòng đọc trung tâm trợ giúp - đặc biệt là đoạn cuối cùng thứ ba có nội dung " Xin lưu ý, tuy nhiên, việc đăng chéo không được khuyến khích trên các trang SE. Chọn một địa điểm tốt nhất để đăng câu hỏi của bạn. Sau đó, nếu nó chứng minh phù hợp hơn một trang web khác, nó có thể được di chuyển. "
Glen_b -Reinstate Monica

Câu trả lời:


2

So sánh các mô hình mạng thần kinh nhân tạo và chuỗi thời gian để dự báo giá cả hàng hóa so sánh hiệu suất của ANN và ARIMA trong việc dự đoán chuỗi thời gian tài chính. Tôi nghĩ rằng đó là một điểm khởi đầu tốt cho đánh giá tài liệu của bạn.

Trong nhiều trường hợp, các mạng thần kinh có xu hướng vượt trội hơn các mô hình dựa trên AR. Tuy nhiên, tôi nghĩ rằng một nhược điểm lớn (không được thảo luận nhiều trong phần học thuật) với các phương pháp học máy tiên tiến hơn là chúng sử dụng hộp đen. Đây là một vấn đề lớn nếu bạn phải giải thích mô hình hoạt động như thế nào với người không biết nhiều về các mô hình này (ví dụ như trong một công ty). Nhưng nếu bạn đang thực hiện phân tích này giống như một công việc ở trường, tôi không nghĩ rằng đây sẽ là một vấn đề.

Nhưng giống như các nhà bình luận trước đây thường nói cách tốt nhất là hình thành một công cụ ước tính đồng bộ trong đó bạn kết hợp hai hoặc nhiều mô hình.


7
Các giới thiệu mà bạn đã trích dẫn giao dịch với các mạng lưới thần kinh đơn giản và quá cũ là không hữu ích (những năm 1990 là một thế kỷ trước). Câu hỏi OP hỏi về mạng lưới thần kinh tái phát với kiến ​​trúc LSTM và bài báo này không đề cập đến điều đó.
horaceT

1
Như @horaceT đã đề cập, bài báo này hơi lỗi thời và nếu bạn có thể đề xuất một bài báo gần đây hơn bao gồm thông tin về các LSTM sẽ rất tuyệt vời. Cảm ơn
ahajib
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.