Tại sao các mô hình VAR của tôi hoạt động tốt hơn với dữ liệu không cố định hơn dữ liệu tĩnh?


9

Tôi đang sử dụng thư viện VAR thống kê của python để mô hình hóa dữ liệu chuỗi thời gian tài chính và một số kết quả khiến tôi bối rối. Tôi biết rằng các mô hình VAR giả định dữ liệu chuỗi thời gian là ổn định. Tôi vô tình phù hợp với một loạt giá gỗ không cố định cho hai loại chứng khoán khác nhau và đáng ngạc nhiên là các giá trị được trang bị và dự báo trong mẫu rất chính xác với số dư cố định, tương đối không đáng kể. Các trên dự báo trong mẫu là 99% và độ lệch chuẩn của loạt dư dự báo là khoảng 10% so với giá trị dự báo.R2

Tuy nhiên, khi tôi chênh lệch giá log và phù hợp với chuỗi thời gian đó với mô hình VAR, các giá trị được trang bị và dự báo sẽ vượt xa mức, nảy trong một phạm vi chặt chẽ xung quanh giá trị trung bình. Do đó, phần dư thực hiện công việc tốt hơn dự báo lợi nhuận của nhật ký so với giá trị được trang bị, với độ lệch chuẩn của phần dư dự báo lớn hơn 15 lần so với chuỗi dữ liệu được trang bị, giá trị 0,007 cho chuỗi dự báo.R2

Tôi có hiểu sai về trang bị so với phần dư trên mô hình VAR hay gây ra một số lỗi khác không? Tại sao một chuỗi thời gian không cố định sẽ dẫn đến dự đoán chính xác hơn so với chuỗi thời gian dừng dựa trên cùng một dữ liệu cơ bản? Tôi đã làm việc một chút với các mô hình ARMA từ cùng một thư viện python và không thấy gì giống như mô hình dữ liệu chuỗi đơn này.


5
Hai sự thật: (1) Khi bạn thụt lùi một bước ngẫu nhiên trên một bước đi ngẫu nhiên khác và giả định không chính xác, bạn hầu như luôn nhận được kết quả có ý nghĩa thống kê cao, ngay cả khi chúng là các quá trình độc lập! . (2) Nếu hai biến được hợp nhất , bạn có thể hồi quy một biến và ước lượng của bạn sẽ hội tụ nhanh hơn hồi quy thông thường, kết quả được gọi là siêu nhất quán.
Matthew Gunn

Cảm ơn rât nhiều. Sự thật số 1 chắc chắn giải thích kết quả cho loạt phim không cố định. Các kết quả từ loạt văn phòng phẩm chắc chắn hoạt động như thể chúng đang thể hiện cái mà bạn gọi là siêu nhất quán, ngoại trừ hai chuỗi không hợp nhất, theo như tôi có thể nói. Tôi đã chạy một hồi quy tuyến tính trên hai chuỗi giá và phần còn lại cách xa văn phòng phẩm. Vì vậy, tôi sẽ phải giả định rằng mô hình VAR được dự báo rất kém bởi vì hai chuỗi trả về không tương quan tự động chéo mạnh mẽ. Các thử nghiệm granger cũng xác nhận điều đó.
jpegiNET

@MatthewGunn, nhận xét của bạn có thể phù hợp hơn như một câu trả lời.
Richard Hardy

Câu trả lời:


9

Hai sự thật:

  1. Khi bạn hồi quy một bước ngẫu nhiên trên một bước đi ngẫu nhiên khác và giả định không chính xác, phần mềm của bạn thường sẽ lấy lại kết quả có ý nghĩa thống kê, ngay cả khi chúng là các quy trình độc lập! Ví dụ, xem các ghi chú bài giảng. (Google cho đi bộ ngẫu nhiên giả và nhiều liên kết sẽ xuất hiện.) Điều gì đang xảy ra? Ước tính OLS thông thường và các lỗi tiêu chuẩn dựa trên các giả định không đúng trong trường hợp đi bộ ngẫu nhiên.

    Giả định các giả định OLS thông thường được áp dụng và hồi quy hai bước ngẫu nhiên độc lập với nhau nói chung sẽ dẫn đến hồi quy với , các hệ số có ý nghĩa cao và tất cả đều hoàn toàn không có thật! Khi có một bước đi ngẫu nhiên và bạn thực hiện hồi quy theo các mức, các giả định thông thường cho OLS bị vi phạm, ước tính của bạn không hội tụ như , định lý giới hạn trung tâm thông thường không áp dụng, và các chỉ số t và giá trị p hồi quy của bạn phun ra là tất cả sai .R2t

  2. Nếu hai biến được hợp nhất , bạn có thể hồi quy một biến và ước lượng của bạn sẽ hội tụ nhanh hơn hồi quy thông thường, kết quả được gọi là siêu nhất quán. Ví dụ. kiểm tra cuốn sách Dòng thời gian của John Cochrane trực tuyến và tìm kiếm "siêu tới hạn".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.