ARIMA dự báo với tính thời vụ và xu hướng, kết quả lạ


9

khi tôi bước vào dự báo với các mô hình ARIMA, tôi đang cố gắng hiểu làm thế nào tôi có thể cải thiện dự báo dựa trên sự phù hợp với ARIMA với tính thời vụ và độ trôi.

Dữ liệu của tôi là chuỗi thời gian tiếp theo (hơn 3 năm, với xu hướng rõ ràng lên và tính thời vụ rõ ràng, dường như không được hỗ trợ bởi tự động tương quan ở độ trễ 12, 24, 36 ??).

    > bal2sum3years.ts
             Jan     Feb     Mar     Apr     May     Jun     Jul     Aug          
    2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 
    2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 
    2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 
             Sep     Oct     Nov     Dec
    2010 2232261 2394644 2468479 2816287
    2011 2480940 2699780 2760268 3206372
    2012 2951516 3119176 3032960 3738256

Mô hình được đề xuất bởi auto.arima(bal2sum3years.ts)đã cho tôi mô hình sau:

    Series: bal2sum3years.ts 
    ARIMA(0,0,0)(0,1,0)[12] with drift         

    Coefficients:
              drift
          31725.567
    s.e.   2651.693

    sigma^2 estimated as 2.43e+10:  log likelihood=-321.02
    AIC=646.04   AICc=646.61   BIC=648.39

Tuy nhiên, acf(bal2sum3years.ts,max.lag=35)hệ số acf không hiển thị cao hơn 0,3. Tuy nhiên, tính thời vụ của dữ liệu là khá rõ ràng - tăng đột biến vào đầu mỗi năm. Đây là những gì loạt bài trông giống như trên biểu đồ: Chuỗi thời gian gốc

Dự báo sử dụng fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE), được gọi theo chức năng forecast(fit), dẫn đến kết quả trong 12 tháng tiếp theo có nghĩa là bằng 12 tháng cuối cùng của dữ liệu cộng với hằng số. Điều này có thể được nhìn thấy bằng cách gọi plot(forecast(fit)),

Dữ liệu thực tế và dự báo

Tôi cũng đã kiểm tra các phần dư, không tương thích nhưng có giá trị trung bình dương (khác không).

Sự phù hợp không mô hình chính xác chuỗi thời gian ban đầu, theo ý kiến ​​của tôi (màu xanh là chuỗi thời gian ban đầu, màu đỏ là fitted(fit):

Bản gốc vs phù hợp

Các khách mời là, mô hình không chính xác? Tui bỏ lỡ điều gì vậy? Làm thế nào tôi có thể cải thiện mô hình? Có vẻ như mô hình thực sự mất 12 tháng qua và thêm một hằng số để đạt được 12 tháng tiếp theo.

Tôi là người mới bắt đầu tương đối trong các mô hình dự báo và thống kê chuỗi thời gian.


" Sự phù hợp không mô hình chính xác chuỗi thời gian ban đầu, theo ý kiến ​​của tôi " - tại sao bạn lại mong đợi nó ??
Glen_b -Reinstate Monica

@Glen_b, ý kiến ​​này dựa trên sự khác biệt mà tôi thấy khi tôi nhìn vào cốt truyện. Nếu tôi đang cố gắng dự báo, ví dụ, doanh số hàng tháng cho mục đích kế toán, lỗi có thể là đáng kể ...
zima

"Những khác biệt tôi thấy khi tôi nhìn vào cốt truyện " là một cách khác để nói " không mô hình chính xác chuỗi thời gian ". Đây không phải là tranh chấp. Biểu hiện của bạn về một mong muốn cho một dự báo tốt hơn là cùng một mong muốn mà mọi người dự báo có. Trong nhiều trường hợp nó có thể rất quan trọng. Tuy nhiên, mong muốn này không đưa thêm thông tin vào dữ liệu. Mỗi mô hình ARIMA - thực sự, bất kỳ mô hình chuỗi thời gian nào liên quan đến nhiệm vụ này - đều có một thuật ngữ lỗi khác không. Sẽ luôn có sự không phù hợp giữa dữ liệu và sự phù hợp. Có điều gì đó khiến bạn nghĩ rằng mô hình của bạn đã bỏ lỡ một cái gì đó có thể được mô hình hóa?
Glen_b -Reinstate Monica

Tôi vừa nghĩ về điều gì đó .. Có lẽ mô hình ARIMA thực sự không thể phản ánh dữ liệu do không tính đến bản chất của dữ liệu - hoạt động của người dùng trên trang web. Tôi nghĩ có thể có các sự kiện khác ảnh hưởng đến các con số, không chỉ theo mùa - chẳng hạn như các sự kiện đặc biệt, khuyến mãi .. Có thể các phương pháp dự đoán khác (không phải ARIMA), nhưng các sự kiện phức tạp hơn liên quan đến kỹ thuật Machine Learning, có thể dự đoán tốt hơn các giá trị. Tôi sẽ nhìn vào đó.
zima

Khá hợp lý. Nếu vậy, bạn sẽ có thể xác định thất bại như vậy trong phần dư. Lưu ý rằng cả mô hình ARIMA và mô hình chuỗi thời gian cấu trúc có thể kết hợp những thứ như các sự kiện đặc biệt và chương trình khuyến mãi thông qua các điều khoản hồi quy; mô hình hồi quy chuỗi thời gian là khá phổ biến.
Glen_b -Reinstate Monica

Câu trả lời:


9

I[12]

Có, thực sự, mô hình được đề xuất là "Tháng 6 này = Tháng 6 + hằng số + lỗi" và tương tự cho các tháng khác.

Chính xác thì có gì sai? Nó dường như là một mô tả tuyệt vời về dữ liệu của bạn.

Bạn có thể thấy phân tách chuỗi thời gian trực quan hơn và dễ giải thích hơn, thậm chí có thể dựa trên Mô hình cấu trúc cơ bản - mô hình có tính thời vụ - nhưng điều đó không nhất thiết ngụ ý một mô hình hoạt động tốt hơn mô hình bạn có. Vẫn còn một hoặc nhiều kỹ thuật phân rã tiêu chuẩn có thể đáng để thử - có rất nhiều điều để nói về một mô hình mà bạn hiểu rõ.


1

Tôi tin rằng vấn đề của chúng tôi là chúng tôi đang nhảy thẳng vào mô hình ARIMA mà không thử các mô hình truyền thống. vì lý do này, bạn có thể thấy mô hình không cho kết quả cần thiết. Trong trường hợp của bạn, tôi đã kiểm tra dữ liệu của bạn, tôi thấy rằng cứ 12 tháng lại có một tính thời vụ rõ ràng, nhưng tôi cũng thấy rằng trung bình di chuyển đơn giản gồm 3 thuật ngữ Điều chỉnh theo mùa: Nhân giống là mô hình tốt nhất. Theo tôi, chúng ta phải thử các thuật toán dự báo truyền thống trước khi chuyển sang bất kỳ kỹ thuật tiên tiến nào. Dự báo 12 tháng cho dữ liệu câu hỏi


1
Mô hình mà bạn đang đề xuất là mô hình ARIMA có dạng (3,0,0) (0,0,0) trong đó bạn đang mã hóa ba hệ số là .333, .333 và .333 và hằng số là 0,0. Do đó, không chỉ giả định dạng của mô hình arima NHƯNG bạn đang giả sử các giá trị của các hệ số VÀ không tồn tại các ngoại lệ trong chuỗi. Cho phép dữ liệu tự nói về hình thức của mô hình và các giá trị tối ưu cho các tham số ... bạn không có gì để mất và rất nhiều thứ để đạt được. Nếu thực sự mô hình của bạn là chính xác thì nó sẽ được tìm thấy .. Tất cả các mô hình arima là các hàm có trọng số của quá khứ.
IrishStat

1
stats.stackexchange.com/questions/40905/ cho biết cách mô hình hóa và arima có trọng số có liên quan với nhau. Theo cách này, một mô hình ARIMA có thể được giải thích là câu trả lời cho câu hỏi Tôi nên sử dụng bao nhiêu giá trị lịch sử để tính tổng của trọng số quá khứ? Chính xác những giá trị đó là gì?
IrishStat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.