Học tăng dần cho mô hình chuỗi thời gian LOESS


9

Tôi hiện đang làm việc trên một số dữ liệu chuỗi thời gian, tôi biết tôi có thể sử dụng mô hình LOESS / ARIMA.

Dữ liệu được ghi vào một vectơ có chiều dài là 1000, là một hàng đợi, cập nhật cứ sau 15 phút,

Do đó, dữ liệu cũ sẽ bật ra trong khi dữ liệu mới đẩy vào vectơ.

Tôi có thể chạy lại toàn bộ mô hình trên bộ lập lịch, ví dụ: giữ lại mô hình cứ sau 15 phút, nghĩa là sử dụng toàn bộ 1000 giá trị để huấn luyện mô hình LOESS, tuy nhiên nó rất không hiệu quả, vì mỗi lần chỉ có một giá trị được chèn trong khi 999 vlau khác vẫn như lần trước.

Vậy làm thế nào tôi có thể đạt được hiệu suất tốt hơn?

Cảm ơn nhiều


3
"Mô hình LOESS / ARIMA" là gì? Bạn có nghĩa là một xu hướng thời gian phi tuyến với các lỗi ARIMA trong đó xu hướng phi tuyến được ước tính bằng LOESS?
Rob Hyndman

xin lỗi tôi có nghĩa là mô hình LOESS hoặc ARIMA. ví dụ: tôi sử dụng LOESS để tìm phần dư dưới dạng: phần dư (loess (x ~ time)). bởi vì dữ liệu x là vectơ với 1000 giá trị, cập nhật cứ sau 15 phút. Làm thế nào tôi có thể có được phần dư một cách hiệu quả, nhưng không chạy lại toàn bộ datset như đầu vào mọi lúc? vì chỉ cập nhật 1 giá trị mọi lúc, 999 giá trị khác vẫn giống như lần trước.
zhang

một phương pháp có thể, có thể sử dụng 1000 giá trị đầu tiên để dự đoán 1000 giá trị tiếp theo (mặc dù LOESS chỉ hỗ trợ dự đoán 4 giá trị), sau đó tính toán phần dư dưới dạng chênh lệch giữa giá trị thực và giá trị dự đoán tương ứng. đây hoàn toàn không phải là mô hình LOESS mà tôi muốn :-(
zhang

Câu trả lời:


1

Hãy để tôi xây dựng lại điều này thành một cái gì đó quen thuộc hơn với tôi. ARIMA tương tự như xấp xỉ với PID. Tôi là không thể thiếu. MA là P. AR có thể được biểu diễn dưới dạng các phương trình khác nhau là thuật ngữ D. LOESS là một tương tự để phù hợp với hình vuông nhỏ nhất (người anh lớn công nghệ cao thực sự).

Vì vậy, nếu tôi muốn cải thiện một mô hình thứ tự thứ hai (PID) thì có thể làm gì?

  • Đầu tiên, tôi có thể sử dụng Bộ lọc Kalman để cập nhật mô hình với một thông tin mới.
  • Tôi cũng có thể nhìn vào một cái gì đó gọi là "cây tăng cường độ dốc". Sử dụng một chất tương tự của chúng, tôi sẽ tạo ra một mô hình ARIMA thứ hai có đầu vào là cả hai đầu vào thô được cung cấp cho đầu tiên, tăng thêm các lỗi của đầu tiên.
  • Tôi sẽ xem xét việc xem xét các lỗi PDF cho nhiều chế độ. Nếu tôi có thể phân cụm các lỗi thì tôi có thể muốn tách các mô hình hoặc sử dụng mô hình Hỗn hợp để tách các đầu vào thành các mô hình con. Các mô hình con có thể tốt hơn trong việc xử lý hiện tượng địa phương tốt hơn một mô hình quy mô lớn duy nhất.

Một trong những câu hỏi mà tôi đã không hỏi là "hiệu suất có nghĩa là gì?". Nếu chúng ta không có một thước đo rõ ràng về lòng tốt thì không có cách nào để biết liệu một phương pháp ứng cử viên có "cải thiện" hay không. Có vẻ như bạn muốn mô hình hóa tốt hơn, thời gian tính toán ngắn hơn và sử dụng thông tin hiệu quả hơn. Có phù du về dữ liệu thực tế cũng có thể thông báo điều này. Nếu bạn đang tạo mô hình gió, thì bạn có thể biết nơi để tìm các mô hình gia tăng hoặc tìm các phép biến đổi cho dữ liệu của bạn hữu ích.


1

Đây là một câu hỏi khác nhau tùy thuộc vào việc bạn đang sử dụng mô hình hoàng thổ hay mô hình ARIMA. Bây giờ tôi sẽ trả lời câu hỏi hoàng thổ, vì tôi nghi ngờ có rất ít hiệu quả có thể xảy ra trong trường hợp ARIMA ngoài việc có thể có một bộ giá trị khởi đầu tốt.

Một mô hình hoàng thổ hoạt động bằng cách điều chỉnh hồi quy có trọng số cho các tập hợp con khác nhau của dữ liệu. Chỉ một tỷ lệ của dữ liệu được sử dụng cho mỗi phù hợp. Vì vậy, mỗi lần bạn chỉnh lại mô hình đã bỏ đi một điểm dữ liệu ở một đầu và thêm một điểm khác ở đầu đối diện, về mặt kỹ thuật bạn chỉ cần điều chỉnh các hồi quy cục bộ sử dụng điểm đầu tiên và điểm cuối. Tất cả các hồi quy cục bộ ở giữa sẽ giống nhau. Chính xác có bao nhiêu trong số các hồi quy cục bộ không bị ảnh hưởng này sẽ phụ thuộc vào tham số làm mịn của bạn trong hoàng thổ.

Bạn có thể hack bất kỳ gói nào bạn đang sử dụng để phù hợp với mô hình của mình để có thể lấy hầu hết các hồi quy cục bộ từ mức phù hợp trước đó và chỉ phù hợp với các gói cần thiết ở đầu và cuối dữ liệu.

Tuy nhiên, đối với tôi điều này chỉ đáng làm nếu chi phí trong thời gian lập trình thêm ít hơn về mặt vật chất so với chi phí trong thời gian máy tính chỉ cần lắp mô hình từ đầu sau mỗi 15 phút. Chỉ với 1000 điểm dữ liệu chắc chắn không phải là một điều lớn lao để phù hợp với mô hình từ đầu mỗi lần.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.