Hiệu ứng lấy mẫu trên các mô hình chuỗi thời gian


9

Tôi đang làm việc rộng rãi với các mô hình chuỗi thời gian tài chính, chủ yếu là AR (I) MA và Kalman.

Một vấn đề tôi tiếp tục phải đối mặt là tần suất lấy mẫu. Ban đầu tôi đã nghĩ nếu được cung cấp khả năng lấy mẫu thường xuyên hơn từ quy trình cơ bản thì tôi nên lấy mẫu càng thường xuyên càng tốt để tôi có số lượng mẫu lớn hơn nhiều, do đó các tham số mô hình của tôi sẽ có ít biến đổi hơn.

Trong thực tế, ý tưởng này đã không trở nên tốt. Điều gì đã xảy ra là nếu quy trình cơ bản không thể hiện đủ biến thể, việc tăng tần suất lấy mẫu thực sự có nghĩa là nhận được rất nhiều giá trị lặp lại (giống nhau). Và việc xây dựng một mô hình dựa trên các giá trị như vậy dẫn đến các mô hình có hệ số mô hình rất nhỏ không dự đoán tốt về tương lai (tất nhiên định nghĩa "tốt" là chủ quan và tần suất tăng đòi hỏi phải dự đoán nhiều bước mẫu hơn trong tương lai đạt được bước thời gian tương tự trong cài đặt tần số thấp hơn). Mô hình học những gì nó gặp nhiều nhất - một đường thẳng.

Tôi muốn thực hiện một phương pháp lấy mẫu thích ứng, tức là lấy mẫu thường xuyên hơn khi có biến thể và ít thường xuyên hơn khi không có. Điều này không dễ dàng, tuy nhiên. Trước hết, tôi không rõ loại thiên vị nào tôi sẽ giới thiệu bằng cách làm như vậy (và sẽ khác nhau tùy thuộc vào cách tôi kích hoạt mẫu / bỏ qua). Thứ hai, các mô hình chuỗi thời gian như ARIMA không phù hợp cho các bước mẫu không đồng đều.

Có một cách tốt để đối phó với vấn đề này? Nó cũng khiến tôi tự hỏi làm thế nào người ta đạt được sự chuyển tiếp liền mạch giữa các mô hình thời gian liên tục và mô hình thời gian rời rạc nếu các mô hình bị ảnh hưởng rất lớn bởi tần số lấy mẫu (đặc biệt là khi các bước thời gian ngày càng nhỏ hơn)? Bất kỳ con trỏ đến các nguồn lực bên ngoài cũng sẽ được đánh giá cao.

Cảm ơn


1
"Mẫu thường xuyên hơn khi có biến thể và ít thường xuyên hơn khi không có" có thể hoạt động trong mẫu, nhưng điều đó sẽ khó sử dụng cho các dự đoán ngoài mẫu. Bạn quan tâm đến cái trước hay cái sau? Ngoài ra, nếu bạn gặp phải các chế độ có độ biến thiên thấp (hoặc hoàn toàn không có biến thể) theo sau là các chế độ có độ biến thiên cao, thì đương nhiên bạn sẽ cần các mô hình riêng biệt cho cả hai. Nếu không, bạn sẽ có một mô hình cho toàn bộ quá trình và lấy mẫu ở các khoảng / tần số không đồng đều có vẻ như không tối ưu. Ngoài ra, đoạn cuối đủ điều kiện là một câu hỏi độc lập, IMHO.
Richard Hardy

1
Ngoài ra, bạn có thể xem xét làm cho tiêu đề của bạn có nhiều thông tin hơn, một cái gì đó để chỉ ra ý tưởng lấy mẫu thường xuyên hơn tại các điểm của các phong trào lớn.
Richard Hardy

1
@RichardHardy Tôi nghĩ về các mô hình chuyển đổi chế độ. Tuy nhiên, họ nổi tiếng là khó đào tạo. Bạn có biết cách xác định và huấn luyện các mô hình chuyển đổi chế độ theo kiểu động (tự động được phát hiện mà không chỉ định trước điểm chuyển đổi chế độ) không? Bạn có thể hiển thị một số gợi ý?
Cagdas Ozgenc

Câu trả lời:


1

ARIMA có thể không phù hợp với mục đích của bạn, nhưng các mô hình không gian trạng thái là: bạn có thể lấy mẫu thường xuyên như bạn muốn (và về nguyên tắc, càng tốt hơn) và thực hiện cập nhật tạm thời theo các khoảng thời gian cố định, như động lực của quy trình giả định của bạn có thể yêu cầu. Một trong những nét đẹp của các mô hình không gian nhà nước là quy trình quan sát tách biệt với quy trình mô hình và các khoảng thời gian riêng biệt có thể được sử dụng cho mỗi mô hình.


Đó không phải là giải quyết vấn đề của tôi. Ngay cả trong một mô hình không gian trạng thái, các hệ số mô hình trước tiên được xác định. Phương pháp cập nhật không gian trạng thái áp dụng cho chính vectơ trạng thái không áp dụng cho ma trận hệ số.
Cagdas Ozgenc

Tôi không hiểu bình luận của bạn. Nếu bạn chuyển mô hình của mình ở dạng không gian trạng thái, bạn có thể tính toán khả năng (giả sử tính chuẩn) bằng bộ lọc Kalman, bất kể tần suất lấy mẫu. Tối đa hóa khả năng đó bạn có thể ước tính các tham số trong ma trận hệ thống.
F. Tusell

Điều đó đúng nếu bạn biết trước mô hình. Khi tất cả các ma trận chuyển tiếp trạng thái và ma trận hiệp phương sai được biết, bạn có thể thực hiện các cập nhật và bạn có thể thực hiện với việc bỏ qua các bước thời gian. Khi bạn chỉ được cung cấp dữ liệu trước tiên, bạn cần suy ra các ma trận chuyển tiếp. Và những ma trận đó sẽ khác nhau giữa thời kỳ biến động cao và thời kỳ biến động thấp.
Cagdas Ozgenc

1

Tôi muốn chỉ cho bạn bài viết

Ghysels, E, P. Santa-Clara và R. Valkanov (2006): "Dự đoán biến động: Lấy hầu hết dữ liệu trả về được lấy mẫu ở các tần số khác nhau", Tạp chí Kinh tế lượng, tập. 131, trang 59-95.

Các tác giả sử dụng một kỹ thuật gọi là MIDAS (lấy mẫu dữ liệu hỗn hợp) để so sánh các ước tính biến động dựa trên dữ liệu được lấy mẫu ở các tần số khác nhau. Phải thừa nhận rằng đây không phải là chính xác những gì bạn đang tìm kiếm nhưng các tác giả cho rằng kỹ thuật của họ phù hợp để so sánh kết quả một cách có ý nghĩa. Có lẽ điều này cung cấp cho bạn ít nhất một cách thứ hai để phân tích dữ liệu của bạn. Dường như đặc biệt trong lĩnh vực kinh tế vĩ mô, cách tiếp cận này đã thu được một số lợi ích.


1
Cảm ơn bạn. Vấn đề không phải là chuỗi thời gian tài chính cụ thể. Lấy bất kỳ tình huống thí nghiệm và mẫu với tần suất cao trong chiều thời gian. Bạn đang kết thúc với một đường thẳng dài và các mô hình học được rằng, một đường thẳng. Bởi vì các mẫu lặp lại quá đông các mẫu có ý nghĩa thực sự phản ánh sự thay đổi trong quy trình cơ bản. Điều này thực sự có vấn đề, và tôi không thể tìm thấy nhiều liên quan đến chủ đề này.
Cagdas Ozgenc

0

lấy mẫu thường xuyên hơn khi có biến thể và ít thường xuyên hơn khi không có

Điều đó có thể hoạt động trong mẫu nhưng sẽ khó sử dụng cho các dự đoán ngoài mẫu, trừ khi bạn tìm ra cách dự đoán biến thiên của chính nó (và điều đó không cần thiết là không thể). Ngoài ra, nếu bạn gặp phải các chế độ có độ biến thiên thấp (hoặc hoàn toàn không có biến thể) theo sau là các chế độ có độ biến thiên cao, thì đương nhiên bạn sẽ cần các mô hình riêng biệt cho cả hai; có một mô hình cho toàn bộ quá trình và lấy mẫu ở các khoảng / tần số không đồng đều sẽ có vẻ như không tối ưu. Bạn đã đề cập đến các mô hình chuyển đổi chế độ (khi trả lời bình luận của tôi), và đó là một minh họa tốt cho những gì bạn có thể cần ở đây.

Tôi nên lấy mẫu càng thường xuyên càng tốt để tôi có số lượng mẫu lớn hơn nhiều, do đó các tham số mô hình của tôi sẽ có ít biến thể hơn.

Điều này không hoàn toàn đúng. Trong cài đặt chuỗi thời gian, nó thường là khoảng thời gian hơn là số lượng quan sát quan trọng. Ví dụ: 120 quan sát hàng tháng (kéo dài 10 năm) là một mẫu có nhiều thông tin hơn 209 quan sát hàng tuần (kéo dài 4 năm) khi kiểm tra sự hiện diện của một đơn vị gốc; thấy này Dave Giles' bài đăng blog và tài liệu tham khảo cuối cùng trong đó. Hoặc xem xét một trường hợp giới hạn trong đó bạn lấy mẫu thường xuyên đến mức về cơ bản bạn đo cùng một thứ nhiều lần. Điều đó sẽ làm tăng kích thước mẫu của bạn nhưng sẽ không mang lại thông tin mới, dẫn đến ấn tượng giả về độ chính xác ước tính. Vì vậy, có lẽ bạn không nên dành quá nhiều thời gian cho việc tăng tần suất lấy mẫu và xây dựng một số mô hình tương ứng?


Bài viết không thực sự trả lời câu hỏi. Chế độ chuyển đổi có lẽ là con đường để đi.
Cagdas Ozgenc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.