Giải thích mô hình ARIMA


19

Tôi có một câu hỏi về các mô hình ARIMA. Giả sử tôi có chuỗi thời gian mà tôi muốn dự báo và mô hình có vẻ như là một cách hay để thực hiện bài tập dự báo. Bây giờ, độ trễ của ám chỉ rằng chuỗi của tôi hôm nay bị ảnh hưởng bởi các sự kiện trước đó. Điều này thật ý nghĩa. Nhưng giải thích các lỗi là gì? Phần còn lại trước đó của tôi (tôi đã tính toán như thế nào) có ảnh hưởng đến giá trị của loạt bài hôm nay không? Làm thế nào các phần dư bị trễ được tính toán trong hồi quy này vì nó là sản phẩm / phần còn lại của hồi quy? ARIMA ( 2 , 2 ) Δ Y t = α 1 Δ Y t - 1 + α 2 Δ Y t - 2 + ν t + θ 1 ν t - 1 + θ 2 ν t - 2 YYtARIMA(2,2)

ΔYt= =α1ΔYt-1+α2ΔYt-2+νt+θ1νt-1+θ2νt-2
Y

4
Tôi nghĩ rằng bạn cần phải nhớ rằng các mô hình ARIMA là atheoretic mô hình, vì vậy các quy tắc thông thường của việc giải thích các hệ số hồi quy ước lượng không đúng áp dụng trong cùng một cách. Các mô hình ARIMA có một số tính năng cần chú ý. Ví dụ: các giá trị của trong AR (1) càng thấp thì tốc độ hội tụ càng nhanh. Nhưng, ví dụ, một mô hình AR (2). Không phải tất cả các mô hình AR (2) đều giống nhau! Ví dụ: nếu điều kiện được thỏa mãn thì AR (2) hiển thị hành vi định kỳ giả và kết quả là dự báo của nó là các chu kỳ ngẫu nhiên. ( α 2 1 + 4 α 2 < 0 )α1(α12+4α2<0)
Graeme Walsh

3
(tiếp ...) Theo cách tương tự, khi xử lý các lỗi tự động của vectơ, người ta có xu hướng diễn giải các hàm đáp ứng xung (IRFs) thay vì các hệ số ước tính; các hệ số thường quá khó để giải thích, nhưng ý nghĩa thường có thể được tạo ra từ IRFs. Vì tò mò, bạn đã tìm thấy nhiều bài báo trong đó tác giả dành nhiều sự quan tâm để diễn giải các hệ số trong mô hình ARIMA chưa?
Graeme Walsh

2
Dường như có một vấn đề ký hiệu. " " không thể đúng, vì các mô hình ARIMA có ba thuật ngữ cho mỗi thành phần AR / I / MA tương ứng, trong khi các mô hình ARMA có hai (ví dụ: ) - nhưng bạn dường như có sự khác biệt đầu tiên, điều này sẽ gợi ý bạn có nghĩa là . Vui lòng chỉnh sửa để phản ánh ý định của bạn. ( p , d , q )ARIMA(2,2)(p,d,q)ARMA(2,2)ARIMA(2,1,2)
Glen_b -Reinstate Monica

2
@Glen_b Tôi nhớ là đã hỏi điều tương tự ở một câu hỏi khác . Nó chỉ ra rằng chúng ta có một bản sao của các loại. Câu hỏi hiện tại và câu hỏi liên quan đến rất giống nhau.
Graeme Walsh

Câu trả lời:


36

Tôi nghĩ rằng bạn cần phải nhớ rằng các mô hình ARIMA là atheoretic mô hình, vì vậy phương pháp thông thường để giải thích hệ số hồi quy ước lượng không thực sự chuyển sang mô hình ARIMA.

Để diễn giải (hoặc hiểu) các mô hình ARIMA ước tính, người ta sẽ làm tốt việc nhận thức các tính năng khác nhau được hiển thị bởi một số mô hình ARIMA phổ biến.

Chúng ta có thể khám phá một số tính năng này bằng cách điều tra các loại dự báo được tạo bởi các mô hình ARIMA khác nhau. Đây là cách tiếp cận chính mà tôi đã thực hiện dưới đây, nhưng một cách thay thế tốt là xem xét các hàm đáp ứng xung hoặc đường thời gian động liên quan đến các mô hình ARIMA khác nhau (hoặc phương trình khác biệt ngẫu nhiên). Tôi sẽ nói về những điều này vào cuối.

Mô hình AR (1)

Hãy xem xét một mô hình AR (1) trong giây lát. Trong mô hình này, chúng ta có thể nói rằng giá trị của thì tốc độ hội tụ càng nhanh (với giá trị trung bình). Chúng ta có thể cố gắng hiểu khía cạnh này của các mô hình AR (1) bằng cách nghiên cứu bản chất của các dự báo cho một nhóm nhỏ các mô hình AR (1) mô phỏng với các giá trị khác nhau cho . α 1α1α1

Tập hợp bốn mô hình AR (1) mà chúng ta sẽ thảo luận có thể được viết bằng ký hiệu đại số là: trong đó là hằng số và phần còn lại của ký hiệu theo sau OP. Có thể thấy, mỗi mô hình chỉ khác nhau về giá trị của .C α 1

Yt= =C+0,95Yt-1+νt                               (1)Yt= =C+0,8Yt-1+νt                                (2)Yt= =C+0,5Yt-1+νt                                (3)Yt= =C+0,4Yt-1+νt                                (4)
Cα1

Trong biểu đồ bên dưới, tôi đã đưa ra các dự báo ngoài mẫu cho bốn mô hình AR (1) này. Có thể thấy rằng các dự báo cho mô hình AR (1) với hội tụ ở tốc độ chậm hơn so với các mô hình khác. Các dự báo cho mô hình AR (1) với hội tụ với tốc độ nhanh hơn các mô hình khác.α 1 = 0,4α1= =0,95α1= =0,4

nhập mô tả hình ảnh ở đây

Lưu ý: khi đường màu đỏ nằm ngang, nó đã đạt đến giá trị trung bình của chuỗi mô phỏng.

Mô hình MA (1)

Bây giờ, hãy xem xét bốn mô hình MA (1) với các giá trị khác nhau cho . Bốn mô hình chúng ta sẽ thảo luận có thể được viết là: Y t = C + 0,95 ν t - 1 + ν t ( 5 )θ1

Yt= =C+0,95νt-1+νt                               (5)Yt= =C+0,8νt-1+νt                                (6)Yt= =C+0,5νt-1+νt                                (7)Yt= =C+0,4νt-1+νt                                (số 8)

Trong biểu đồ dưới đây, tôi đã đưa ra các dự báo ngoài mẫu cho bốn mô hình MA (1) khác nhau này. Như biểu đồ cho thấy, hành vi của các dự báo trong cả bốn trường hợp đều giống nhau rõ rệt; hội tụ nhanh (tuyến tính) với giá trị trung bình. Lưu ý rằng có ít sự đa dạng hơn trong tính năng động của các dự báo này so với các mô hình AR (1).

nhập mô tả hình ảnh ở đây

Lưu ý: khi đường màu đỏ nằm ngang, nó đã đạt đến giá trị trung bình của chuỗi mô phỏng.

Mô hình AR (2)

Mọi thứ trở nên thú vị hơn rất nhiều khi chúng ta bắt đầu xem xét các mô hình ARIMA phức tạp hơn. Lấy ví dụ mô hình AR (2). Đây chỉ là một bước tiến nhỏ từ mô hình AR (1), phải không? Chà, người ta có thể muốn nghĩ như vậy, nhưng tính năng động của các mô hình AR (2) khá phong phú về chủng loại như chúng ta sẽ thấy trong giây lát.

Hãy khám phá bốn mô hình AR (2) khác nhau:

Yt= =C+1.7Yt-1-0,8Yt-2+νt                               (9)Yt= =C+0,9Yt-1-0,2Yt-2+νt                                (10)Yt= =C+0,5Yt-1-0,2Yt-2+νt                                (11)Yt= =C+0,1Yt-1-0,7Yt-2+νt                                (12)

Các dự báo ngoài mẫu liên quan đến từng mô hình này được hiển thị trong biểu đồ bên dưới. Một điều khá rõ ràng là mỗi loại khác nhau đáng kể và chúng cũng là một nhóm khá đa dạng so với các dự báo mà chúng ta đã thấy ở trên - ngoại trừ các dự báo của mô hình 2 (cốt truyện trên cùng bên phải) hoạt động tương tự như các AR (1) mô hình.

nhập mô tả hình ảnh ở đây

Lưu ý: khi đường màu đỏ nằm ngang, nó đã đạt đến giá trị trung bình của chuỗi mô phỏng.

Điểm mấu chốt ở đây là không phải tất cả các mô hình AR (2) đều có cùng động lực! Ví dụ: nếu điều kiện, được thỏa mãn thì mô hình AR (2) hiển thị hành vi định kỳ giả và kết quả là dự báo của nó sẽ xuất hiện dưới dạng chu kỳ ngẫu nhiên. Mặt khác, nếu điều kiện này không được thỏa mãn, các chu kỳ ngẫu nhiên sẽ không có mặt trong các dự báo; thay vào đó, các dự báo sẽ giống với các dự báo cho mô hình AR (1).

α12+4α2<0,

Điều đáng chú ý là điều kiện trên xuất phát từ giải pháp chung cho dạng đồng nhất của phương trình sai phân tuyến tính, tự trị, bậc hai (có gốc phức). Nếu điều này nếu xa lạ với bạn, tôi khuyên bạn nên sử dụng cả Chương 1 của Hamilton (1994) và Chương 20 của Hoy et al. (2001).

Kiểm tra điều kiện trên cho bốn mô hình AR (2) cho kết quả như sau:

(1.7)2+4(-0,8)= =-0,31<0                               (13)(0,9)2+4(-0,2)= =0,01>0                                 (14)(0,5)2+4(-0,2)= =-0,55<0                               (15)(0,1)2+4(-0,7)= =-2,54<0                               (16)

Như mong đợi bởi sự xuất hiện của các dự báo được vẽ, điều kiện được thỏa mãn cho cả bốn mô hình ngoại trừ mô hình 2. Nhớ lại từ biểu đồ, dự báo của mô hình 2 hoạt động ("bình thường") tương tự như dự báo của mô hình AR (1). Các dự báo liên quan đến các mô hình khác có chứa chu kỳ.

Ứng dụng - Mô hình hóa lạm phát

Bây giờ chúng ta có một số nền tảng dưới chân, hãy thử diễn giải mô hình AR (2) trong một ứng dụng. Hãy xem xét mô hình sau cho tỷ lệ lạm phát ( ): Một biểu thức tự nhiên để liên kết với một mô hình như vậy sẽ giống như: "lạm phát hôm nay phụ thuộc vào mức độ lạm phát ngày hôm qua và mức độ lạm phát vào ngày hôm trước"πt

πt= =C+α1πt-1+α2πt-2+νt.
. Bây giờ, tôi sẽ không tranh luận về cách giải thích như vậy, nhưng tôi đề nghị nên thận trọng và chúng ta nên đào sâu hơn một chút để đưa ra cách giải thích phù hợp. Trong trường hợp này chúng ta có thể hỏi, lạm phát liên quan đến mức lạm phát trước đây theo cách nào? Có chu kỳ không? Nếu vậy, có bao nhiêu chu kỳ? Chúng ta có thể nói điều gì đó về đỉnh và máng không? Làm thế nào nhanh chóng làm cho các dự báo hội tụ đến trung bình? Và như vậy.

Đây là những loại câu hỏi chúng ta có thể hỏi khi cố gắng diễn giải mô hình AR (2) và như bạn có thể thấy, nó không đơn giản như lấy một hệ số ước tính và nói rằng "tăng 1 đơn vị trong biến này có liên quan đến một- nhiều đơn vị tăng trong biến phụ thuộc " - tất nhiên đảm bảo gắn điều kiện paribus ceteris vào câu lệnh đó.

Hãy nhớ rằng trong cuộc thảo luận của chúng tôi cho đến nay, chúng tôi chỉ khám phá một lựa chọn các mô hình AR (1), MA (1) và AR (2). Chúng tôi thậm chí không nhìn vào động lực của các mô hình ARMA hỗn hợp và mô hình ARIMA liên quan đến độ trễ cao hơn.

Để cho thấy việc giải thích các mô hình rơi vào danh mục đó khó như thế nào, hãy tưởng tượng một mô hình lạm phát khác - ARMA (3,1) với bị ràng buộc về 0: α2

πt= =C+α1πt-1+α3πt-3+θ1νt-1+νt.

Nói những gì bạn thích, nhưng ở đây tốt hơn là cố gắng hiểu động lực của chính hệ thống. Như trước đây, chúng ta có thể xem và xem loại dự báo nào mà mô hình tạo ra, nhưng cách tiếp cận khác mà tôi đã đề cập ở đầu câu trả lời này là xem xét chức năng đáp ứng xung hoặc đường dẫn thời gian liên quan đến hệ thống.

Điều này đưa tôi đến phần tiếp theo của câu trả lời của mình, nơi chúng ta sẽ thảo luận về các chức năng đáp ứng xung.

Chức năng đáp ứng xung

Những người quen thuộc với tự động vectơ (VAR) sẽ nhận thức được rằng người ta thường cố gắng hiểu mô hình VAR ước tính bằng cách diễn giải các hàm đáp ứng xung; thay vì cố gắng diễn giải các hệ số ước tính thường quá khó để diễn giải.

Cách tiếp cận tương tự có thể được thực hiện khi cố gắng hiểu các mô hình ARIMA. Đó là, thay vì cố gắng hiểu ý nghĩa của các tuyên bố (phức tạp) như "lạm phát ngày nay phụ thuộc vào lạm phát của ngày hôm qua và lạm phát từ hai tháng trước, nhưng không phải là lạm phát của tuần trước!" , thay vào đó chúng ta vẽ đồ thị hàm phản ứng xung và cố gắng hiểu ý nghĩa của nó.

Ứng dụng - Bốn biến vĩ mô

Trong ví dụ này (dựa trên Leamer (2010)), hãy xem xét bốn mô hình ARIMA dựa trên bốn biến kinh tế vĩ mô; Tăng trưởng GDP, lạm phát, tỷ lệ thất nghiệp và lãi suất ngắn hạn. Bốn mô hình đã được ước tính và có thể được viết là: trong đó biểu thị tăng trưởng GDP tại thời điểm , biểu thị lạm phát, biểu thị tỷ lệ thất nghiệp và

Yt= =3,20+0,22Yt-1+0,15Yt-2+νtπt= =4.10+0,46πt-1+0,31πt-2+0,16πt-3+0,01πt-4+νtbạnt= =6.2+1,58bạnt-1-0,64bạnt-2+νtrt= =6.0+1,18rt-1-0,23rt-2+νt
Yttπbạnr biểu thị lãi suất ngắn hạn (kho bạc 3 tháng).

Các phương trình cho thấy tăng trưởng GDP, tỷ lệ thất nghiệp và lãi suất ngắn hạn được mô hình hóa theo quy trình AR (2) trong khi lạm phát được mô hình hóa theo quy trình AR (4).

Thay vì cố gắng diễn giải các hệ số trong mỗi phương trình, hãy vẽ các hàm đáp ứng xung (IRFs) và thay vào đó diễn giải chúng. Biểu đồ dưới đây cho thấy các hàm đáp ứng xung liên quan đến từng mô hình này.

nhập mô tả hình ảnh ở đây

Đừng coi đây là một lớp học chính trong việc diễn giải các IRF - hãy nghĩ về nó giống như một giới thiệu cơ bản - nhưng dù sao, để giúp chúng tôi diễn giải các IRF chúng ta sẽ cần phải làm quen với hai khái niệm; đàkiên trì .

Hai khái niệm này được định nghĩa trong Leamer (2010) như sau:

Động lượng : Động lượng là xu hướng tiếp tục di chuyển theo cùng một hướng. Hiệu ứng động lượng có thể bù lại lực hồi quy (hội tụ) về giá trị trung bình và có thể cho phép một biến di chuyển khỏi trung bình lịch sử của nó, trong một thời gian, nhưng không phải là vô thời hạn.

Tính bền bỉ : Một biến liên tục sẽ tồn tại xung quanh vị trí của nó và chỉ hội tụ chậm với ý nghĩa lịch sử.

Được trang bị kiến ​​thức này, bây giờ chúng tôi đặt câu hỏi: giả sử một biến có ý nghĩa lịch sử của nó và nó nhận được một cú sốc một đơn vị tạm thời trong một giai đoạn duy nhất, biến đó sẽ phản ứng như thế nào trong các giai đoạn tương lai? Điều này giống như hỏi những câu hỏi mà chúng tôi đã hỏi trước đây, chẳng hạn như, các dự báo có chứa chu kỳ không? , làm thế nào nhanh chóng làm cho các dự báo hội tụ đến trung bình? v.v.

Cuối cùng, bây giờ chúng ta có thể cố gắng diễn giải các IRF.

Sau cú sốc một đơn vị, tỷ lệ thất nghiệp và lãi suất ngắn hạn (kho bạc 3 tháng) được tiếp tục từ ý nghĩa lịch sử của chúng. Đây là hiệu ứng động lượng. IRFs cũng cho thấy tỷ lệ thất nghiệp vượt quá mức lãi suất ngắn hạn.

Chúng tôi cũng thấy rằng tất cả các biến trở về phương tiện lịch sử của chúng (không ai trong số chúng "nổ tung"), mặc dù mỗi biến làm điều này với tốc độ khác nhau. Ví dụ, tăng trưởng GDP trở lại mức trung bình lịch sử sau khoảng 6 giai đoạn sau một cú sốc, tỷ lệ thất nghiệp trở về mức trung bình lịch sử sau khoảng 18 giai đoạn, nhưng lạm phát và lãi suất ngắn hạn phải mất hơn 20 giai đoạn để trở về phương tiện lịch sử. Theo nghĩa này, tăng trưởng GDP là ít nhất trong bốn biến số trong khi lạm phát có thể nói là rất dai dẳng.

Tôi nghĩ rằng đó là một kết luận công bằng khi nói rằng chúng tôi đã quản lý (ít nhất là một phần) để hiểu ý nghĩa của bốn mô hình ARIMA đang nói với chúng tôi về từng biến trong bốn biến vĩ mô.

Phần kết luận

Thay vì cố gắng diễn giải các hệ số ước tính trong các mô hình ARIMA (khó đối với nhiều mô hình), thay vào đó, hãy thử tìm hiểu động lực học của hệ thống. Chúng ta có thể thử điều này bằng cách khám phá các dự báo được tạo ra bởi mô hình của chúng tôi và bằng cách vẽ đồ thị hàm phản ứng xung.

[Tôi đủ hạnh phúc để chia sẻ mã R của mình nếu có ai muốn nó.]

Tài liệu tham khảo

  • Hamilton, JD (1994). Phân tích chuỗi thời gian (Tập 2). Princeton: Báo chí đại học Princeton.
  • Leamer, E. (2010). Các mô hình và câu chuyện kinh tế vĩ mô - Hướng dẫn về MBA, Springer.
  • Stengos, T., M. Hoy, J. Hepnois, C. McKenna và R. Rees (2001). Toán học Kinh tế, ấn bản 2, MIT Press: Cambridge, MA.

2
Yêu thích việc áp dụng IRF cho những người không phải VAR. Chúng dường như luôn được liên kết và tôi chưa bao giờ nghĩ đến việc sử dụng IRF trên các ARIMA đơn thuần. (Điều đó cộng với, ai thực sự có thể hiểu các thuật ngữ MA làm gì?)
Wayne

2
Thật là một câu trả lời tuyệt vời!
Richard Hardy

9

MMột()

ΔYt= =Σj= =0ψjνt-j

MMột(1)MộtR(1)

Yt= =νt+θ1νt-1

Yt= =ρYt-1+νt= =νt+ρνt-1+ρ2νt-1+...

bạn có thể nói rằng các thuật ngữ lỗi trong các mô hình ARMA giải thích ảnh hưởng "ngắn hạn" của quá khứ và các thuật ngữ bị trễ giải thích ảnh hưởng "dài hạn". Phải nói rằng tôi không nghĩ rằng điều này giúp ích rất nhiều và thường không ai bận tâm đến việc giải thích chính xác các hệ số ARMA. Mục tiêu thường là để có được một mô hình thích hợp và sử dụng nó để dự báo.


+1 Đây là ít nhiều những gì tôi đã cố gắng nhận được trong các nhận xét của tôi ở trên.
Graeme Walsh

Ha, tôi không thấy bình luận của bạn, khi tôi đang viết câu trả lời. Tôi đề nghị chuyển đổi chúng để trả lời.
mpiktas

8

nc1,c2,...,cn

Y(t)= =c1Y(t-1)+c2Y(t-2)+c3Y(t-3)+...+cnY(t-n)+một(t)

Theo cách này, một mô hình ARIMA có thể được giải thích là câu trả lời cho câu hỏi

  1. Tôi nên sử dụng bao nhiêu giá trị lịch sử để tính tổng của quá khứ?
  2. Chính xác những giá trị đó là gì?
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.