Chuỗi thời gian sinh học đa biến: VAR và tính thời vụ


15

Tôi có một bộ dữ liệu chuỗi thời gian đa biến bao gồm các biến sinh học và môi trường tương tác (cộng với có thể một số biến ngoại sinh). Bên cạnh tính thời vụ, không có xu hướng dài hạn rõ ràng trong dữ liệu. Mục đích của tôi là để xem các biến nào có liên quan với nhau. Dự báo không thực sự được tìm kiếm.

Là người mới trong phân tích chuỗi thời gian, tôi đọc một số tài liệu tham khảo. Theo như tôi hiểu, mô hình Vector AutoreTHERive (VAR) sẽ phù hợp, nhưng tôi không cảm thấy thoải mái với tính thời vụ và hầu hết các ví dụ tôi thấy lĩnh vực kinh tế liên quan (như thường xuyên với phân tích chuỗi thời gian) mà không theo mùa.

Tôi nên làm gì với dữ liệu theo mùa của mình? Tôi đã xem xét việc giải thích chúng - ví dụ như trong R, tôi sẽ sử dụng decomposevà sau đó sử dụng các $trend + $randgiá trị để thu được tín hiệu có vẻ ổn định (như được đánh giá theo acf). Kết quả của mô hình VAR làm tôi bối rối (mô hình 1 độ trễ được chọn trong khi tôi sẽ mong đợi trực giác nhiều hơn và chỉ các hệ số cho sự tự phát - và không phải là hồi quy với các biến bị trễ khác - là đáng kể). Tôi có làm gì sai không, hay tôi nên kết luận rằng các biến của tôi không liên quan (tuyến tính) / mô hình của tôi không phải là mô hình tốt (câu hỏi phụ: có phi tuyến tính tương đương với VAR không?).

[Ngoài ra, tôi đọc có lẽ tôi có thể sử dụng các biến theo mùa giả, mặc dù tôi không thể tìm ra chính xác cách thực hiện nó].

Đề xuất từng bước sẽ rất được đánh giá cao, vì chi tiết cho người dùng có kinh nghiệm thực sự có thể là thông tin cho tôi (và đoạn mã R hoặc liên kết đến các ví dụ cụ thể rất được hoan nghênh, tất nhiên).


2
Phần lớn phụ thuộc vào cách bạn nghĩ về tính thời vụ. Việc đọc tài liệu chắp vá của tôi chỉ ra rằng các nhà kinh tế thường coi tính thời vụ là một mối phiền toái không thú vị trong khi các nhà khoa học môi trường thường cảm thấy tích cực hơn nhiều về nó. Phương pháp biến giả như được sử dụng trong bản lề kinh tế, thường xuyên, trên dữ liệu là hàng quý hoặc hàng tháng và ảnh hưởng của ngày lễ (theo mọi nghĩa của từ này) đôi khi tăng đột biến; dữ liệu môi trường đôi khi bạn có thể làm tốt với một số thuật ngữ Fourier (hình sin) và không cần phải dùng đến các hình nộm.
Nick Cox

2
Cảm ơn, @Nick Cox. Các thuật ngữ Fourier dường như không phải là một giải pháp trong trường hợp cụ thể của tôi, trong đó các biến thể hiện mô hình theo mùa phức tạp hơn tín hiệu hình sin (trừ khi tôi sử dụng một số sóng hài, nhưng đây không phải là mục đích nhiều ở đây). Và mặc dù tính thời vụ rõ ràng không phải là một thuật ngữ phiền toái không đáng quan tâm trong trường hợp của tôi, tôi đã tìm kiếm một cái gì đó giúp tôi giải thích sự thay đổi thêm trong dữ liệu ngoài tính thời vụ (nghĩa là xu hướng dài hạn) như là một chức năng của các biến khác.
ztl

4
Một mô hình ARMA đa biến thì sao? Nó tương tự như VAR, nhưng nếu tôi hiểu chính xác, cho phép tương tác linh hoạt hơn giữa các biến. Một số người khác có thể xác nhận / từ chối sự nghi ngờ của tôi.
rbatt

Câu trả lời:


1

Tôi biết câu hỏi này đã khá cũ nhưng vẫn chưa được trả lời. Có lẽ câu hỏi chính không phải là làm thế nào để loại bỏ chu kỳ theo mùa trong dữ liệu mà là một phần của nó, vì vậy tôi sẽ thử: Để loại bỏ tính thời vụ khỏi bộ dữ liệu, có một số phương pháp, từ trung bình tổng hợp hàng tháng đơn giản đến lắp một hàm hình sin (hoặc một hàm điều hòa thích hợp khác) bằng các phương pháp lắp phi tuyến tính như Nelder-Mead.

Cách dễ nhất là trung bình dữ liệu thuộc về tất cả các Januaries, cho tất cả Februaries, v.v., tức là bạn tạo một chu kỳ hàng năm tổng hợp, sau đó bạn có thể trừ khỏi dữ liệu của mình

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.