Khi nào thì ghi nhật ký biến đổi một chuỗi thời gian trước khi lắp mô hình ARIMA


26

Trước đây tôi đã sử dụng pro pro để dự báo chuỗi thời gian đơn biến, nhưng tôi đang chuyển luồng công việc của mình sang R. Gói dự báo cho R chứa rất nhiều chức năng hữu ích, nhưng một điều nó không làm là bất kỳ loại chuyển đổi dữ liệu nào trước khi chạy tự động .arima (). Trong một số trường hợp dự báo pro quyết định ghi nhật ký dữ liệu biến đổi trước khi thực hiện dự báo, nhưng tôi vẫn chưa tìm hiểu tại sao.

Vì vậy, câu hỏi của tôi là: khi nào tôi nên đăng nhập chuyển đổi chuỗi thời gian của mình trước khi thử các phương pháp ARIMA trên đó?

/ chỉnh sửa: sau khi đọc câu trả lời của bạn, tôi sẽ sử dụng một cái gì đó như thế này, trong đó x là chuỗi thời gian của tôi:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

Điều này có nghĩa không?

Câu trả lời:


21

Một số hãy cẩn thận trước khi tiến hành. Như tôi thường đề xuất với các sinh viên của mình, chỉ sử dụng auto.arima()những thứ như một xấp xỉ đầu tiên cho kết quả cuối cùng của bạn hoặc nếu bạn muốn có mô hình tuyệt vời khi bạn kiểm tra xem mô hình dựa trên lý thuyết đối thủ của bạn có làm tốt hơn không.

Dữ liệu

Bạn rõ ràng phải bắt đầu từ mô tả dữ liệu chuỗi thời gian bạn đang làm việc. Trong kinh tế lượng vĩ mô, bạn thường làm việc với dữ liệu tổng hợp và các phương tiện hình học (đáng ngạc nhiên) có bằng chứng thực nghiệm hơn cho dữ liệu chuỗi thời gian vĩ mô, có lẽ vì hầu hết chúng có thể phân tách thành xu hướng tăng theo cấp số nhân .

Theo cách mà đề xuất của Rob "trực quan" hoạt động theo chuỗi thời gian với phần rõ ràng theo mùa , vì dữ liệu hàng năm thay đổi chậm không rõ ràng cho sự gia tăng của biến thể. May mắn thay xu hướng tăng theo cấp số nhân thường được nhìn thấy (nếu nó có vẻ là tuyến tính, hơn là không cần nhật ký).

Mô hình

Y(t)= =X1α1(t)...Xkαk(t)ε(t)

Trong nhật ký kinh tế lượng tài chính là một điều phổ biến do sự phổ biến của lợi nhuận log, bởi vì ...

Các phép biến đổi log có các thuộc tính đẹp

Trong mô hình hồi quy log-log, đó là giải thích tham số ước tính, giả sử độ co giãn của Y ( t ) trên X i ( t ) .αtôiY(t)Xtôi(t)

Trong các mô hình sửa lỗi, chúng tôi có một giả định mạnh mẽ hơn về mặt thực nghiệm rằng tỷ lệ ổn định hơn ( đứng yên ) so với sự khác biệt tuyệt đối.

Trong kinh tế lượng tài chính, thật dễ dàng để tổng hợp lợi nhuận log theo thời gian .

Có nhiều lý do khác không được đề cập ở đây.

Cuối cùng

Lưu ý rằng chuyển đổi log thường được áp dụng cho các biến không âm (mức). Nếu bạn quan sát sự khác biệt của hai chuỗi thời gian (ví dụ xuất khẩu ròng), thậm chí không thể lấy nhật ký, bạn phải tìm kiếm dữ liệu gốc theo cấp độ hoặc giả sử dạng của xu hướng chung bị trừ.

[ bổ sung sau khi chỉnh sửa ] Nếu bạn vẫn muốn có một tiêu chí thống kê khi nào thực hiện chuyển đổi nhật ký, một giải pháp đơn giản sẽ là bất kỳ thử nghiệm nào cho tính không đồng nhất. Trong trường hợp phương sai gia tăng, tôi muốn giới thiệu Goldfeld-Quandt Test hoặc tương tự như vậy. Trong R, nó nằm trong library(lmtest)và được biểu thị bởi gqtest(y~1)hàm. Đơn giản là hồi quy về thuật ngữ chặn nếu bạn không có bất kỳ mô hình hồi quy nào, ylà biến phụ thuộc của bạn.


Cảm ơn bạn về thông tin. Với thử nghiệm GQ, giá trị p càng thấp thì khả năng phân phối càng không đồng nhất?
Zach

@Zach: chính xác, lấy 5% chẳng hạn, tất nhiên nếu bạn không định khai thác dữ liệu. Cá nhân tôi bắt đầu từ các giả định mô hình.
Dmitrij Celov

@Dmitrij. Cảm ơn bạn. Tôi chỉ muốn chắc chắn rằng tôi đang giải thích đầu ra chính xác.
Zach

29

Vẽ đồ thị của dữ liệu theo thời gian. Nếu có vẻ như biến thể tăng theo cấp độ của chuỗi, hãy ghi nhật ký. Nếu không thì mô hình hóa dữ liệu gốc.


3
Đây là một câu hỏi: hiệu ứng nếu bạn ghi nhật ký và chúng không được gọi là gì? Tôi đã thích nó khi làm việc với chuỗi thời gian yêu cầu chuyển đổi nhật ký, bởi vì (theo tôi hiểu), các hệ số là tỷ lệ và ở các giá trị nhỏ gần bằng tỷ lệ phần trăm. (Ví dụ: exp (0,05) = 1,051.)
Wayne

4

Bởi trái cây của họ Bạn sẽ biết chúng

Giả định (sẽ được kiểm tra) là các lỗi từ mô hình có phương sai không đổi. Lưu ý điều này không có nghĩa là các lỗi từ một mô hình giả định. Khi bạn sử dụng một phân tích đồ họa đơn giản, về cơ bản bạn đang giả định một mô hình tuyến tính theo thời gian.

Do đó, nếu bạn có một mô hình không đầy đủ, chẳng hạn như có thể được đề xuất bởi một biểu đồ dữ liệu ngẫu nhiên theo thời gian, bạn có thể kết luận không chính xác về sự cần thiết phải chuyển đổi năng lượng. Box và Jenkins đã làm như vậy với ví dụ Dữ liệu Hàng không của họ. Họ đã không chiếm 3 giá trị bất thường trong dữ liệu gần đây nhất do đó họ kết luận không chính xác rằng có sự thay đổi cao hơn trong phần dư ở mức cao nhất của chuỗi.

Để biết thêm về chủ đề này, vui lòng xem http://www.autobox.com/pdfs/vegas_ibf_09a.pdf


1

Bạn có thể muốn chuyển đổi chuỗi khi chúng có dạng hình học một cách tự nhiên hoặc trong đó giá trị thời gian của khoản đầu tư ngụ ý rằng bạn sẽ so sánh với một trái phiếu rủi ro tối thiểu có lợi nhuận dương. Điều này sẽ làm cho chúng "tuyến tính hóa" hơn, và do đó phù hợp với mối quan hệ tái phát khác biệt đơn giản.


1
Biến đổi giống như thuốc: Một số tốt cho bạn và một số thì không. Nếu bạn không quan tâm đến việc kiểm tra giả thuyết thống kê thì bạn có thể giả sử bất cứ điều gì bạn thích. Các thử nghiệm tham số của giả thuyết có các giả định về giá trị lỗi, bỏ qua chúng trong tình trạng nguy hiểm của bạn.
IrishStat

1
Thật vậy. Tôi đã nói rằng quá trình cần phải là hình học. Không chuyển đổi cũng có thể dẫn đến sai sót trong suy luận. Tôi không thấy nơi tôi đang đề nghị một người bỏ qua các giả định liên quan đến các điều kiện suy luận hợp lệ.
DWin

1
stats.stackexchange.com/questions/6498/ đã bao gồm một cuộc thảo luận về thời điểm và lý do để chuyển đổi. "Thực tế" rằng các sản phẩm gốc là "hình học" không suy ra rằng phần dư từ một mô hình thích hợp có độ lệch chuẩn tỷ lệ thuận với giá trị trung bình. Nó có thể NHƯNG nó phải được chứng minh bằng thực nghiệm hoặc ít nhất là đã được thử nghiệm.
IrishStat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.