Có tiêu chuẩn vàng nào cho việc lập mô hình chuỗi thời gian không đều?


45

Trong lĩnh vực kinh tế (tôi nghĩ), chúng tôi có ARIMA và GARCH cho chuỗi thời gian cách đều đặn và Poisson, Hawkes để mô hình hóa các quy trình điểm, vì vậy, về các nỗ lực mô hình hóa chuỗi thời gian cách đều (không đều) - có (ít nhất) bất kỳ thực tiễn phổ biến nào ?

(Nếu bạn có một số kiến ​​thức trong chủ đề này, bạn cũng có thể mở rộng bài viết wiki tương ứng .)

Phiên bản (về các giá trị bị thiếu và chuỗi thời gian cách nhau không đều):

Trả lời bình luận của @Lucas Reis. Nếu khoảng cách giữa các phép đo hoặc biến thực hiện được đặt cách nhau do (ví dụ) quá trình Poisson thì không có nhiều chỗ cho loại chính quy này, nhưng nó tồn tại thủ tục đơn giản: t(i)là chỉ số thời gian thứ i của biến x (thời gian thứ i của thực hiện x), sau đó xác định khoảng cách giữa các lần đo như g(i)=t(i)-t(i-1), sau đó chúng tôi rời rạc g(i)sử dụng liên tục c, dg(i)=floor(g(i)/cvà tạo ra chuỗi thời gian mới với số các giá trị trống giữa các quan sát cũ từ chuỗi thời gian ban đầu ii+1tương đương để DG (i), nhưng vấn đề là điều này thủ tục có thể dễ dàng tạo ra chuỗi thời gian với số lượng dữ liệu bị thiếu lớn hơn số lượng quan sát, do đó, việc ước tính hợp lý các giá trị quan sát bị thiếu có thể là không thể và quá lớncxóa "cấu trúc thời gian / sự phụ thuộc thời gian, v.v." của vấn đề được phân tích (trường hợp cực đoan được đưa ra bằng cách lấy c>=max(floor(g(i)/c))mà chỉ đơn giản thu gọn chuỗi thời gian cách đều đặn thành khoảng cách đều đặn

Phiên bản 2 (chỉ để giải trí): Kế toán hình ảnh cho các giá trị bị thiếu trong chuỗi thời gian cách nhau không đều hoặc thậm chí là trường hợp của quá trình điểm.


Chỉ cần làm rõ, khi bạn nói "khoảng cách không đều", bạn không có nghĩa là "cách đều đặn nhưng thiếu giá trị", phải không?
Wayne

2
Không :) t(i)- thời gian x[t(i)],x[t(i+1)],x[t(i+2)]...t(j+1)-t(j)không đổi. Dữ liệu được thu thập trong một trang viên phân tán hoặc không đồng bộ.
Qbik


2
Điều gì về nội suy và thực hiện phân tích với các giá trị nội suy, thường xuyên cách nhau? Bất cứ ai cũng biết những tác động của phương pháp này là gì?
Lucas Reis

Điều gì về đầu tiên mô hình hóa thời gian của các điểm, và sau đó là các giá trị của các điểm, có điều kiện về thời gian của chúng? Tôi tin rằng "các quy trình điểm được đánh dấu" là thuật ngữ.
PeterR

Câu trả lời:


26

Nếu các quan sát của một quá trình ngẫu nhiên được đặt cách đều đặn, cách tự nhiên nhất để mô hình hóa các quan sát là các quan sát thời gian rời rạc từ một quá trình thời gian liên tục.

Điều cần thiết chung của một đặc tả mô hình là phân phối chung của các quan sát được quan sát tại các thời điểm và, ví dụ, điều này có thể được chia thành các bản phân phối có điều kiện cho . Nếu quy trình là một quá trình Markov, phân phối có điều kiện này phụ thuộc vào không phụ thuộc vào và nó phụ thuộc vào và . Nếu quy trình là đồng nhất thời gian, sự phụ thuộc vào các điểm thời gian chỉ thông qua sự khác biệt của chúng .t 1 < t 2 < ... < t n X i X i - 1X1,,Xnt1<t2<<tnXiX i - 1 - X i - 2 , ... , X 1 - t i t i - 1 t i - t i - 1Xi1,,X1Xi1 Xi2,,X1 titi1titi1

Chúng ta thấy rằng nếu chúng ta có các quan sát tương đương (với , giả sử) từ quy trình Markov đồng nhất theo thời gian, chúng ta chỉ cần xác định một phân phối xác suất có điều kiện duy nhất, , để chỉ định một mô hình. khác, chúng ta cần chỉ định toàn bộ bộ sưu tập phân phối xác suất có điều kiện được lập chỉ mục bởi sự khác biệt về thời gian của các quan sát để chỉ định một mô hình. Là thứ hai, trên thực tế, cách dễ dàng nhất thực hiện bằng cách xác định một gia đình thời gian liên tục phân bố xác suất có điều kiện.P 1 P t i - t i - 1 P ttiti1=1P1Ptiti1Pt

Một cách phổ biến để có được một đặc tả mô hình thời gian liên tục là thông qua phương trình vi phân ngẫu nhiên (SDE) Một nơi tốt để bắt đầu với việc thống kê cho các mô hình SDE là Mô phỏng và Suy luận về Phương trình vi phân ngẫu nhiên của Stefano Iacus. Có thể có nhiều phương pháp và kết quả được mô tả cho các quan sát tương đương, nhưng điều này thường chỉ thuận tiện cho việc trình bày và không cần thiết cho ứng dụng. Một trở ngại chính là đặc tả SDE hiếm khi cho phép khả năng rõ ràng khi bạn có các quan sát rời rạc, nhưng có các phương trình ước lượng phương trình ước tính được phát triển tốt.

dXt=a(Xt)dt+b(Xt)dBt.

Nếu bạn muốn vượt ra ngoài Markov, các mô hình biến động ngẫu nhiên giống như các mô hình ARCH (G) cố gắng mô hình hóa một phương sai không đồng nhất (biến động). Người ta cũng có thể xem xét các phương trình trễ như là các tương tự thời gian liên tục của các quá trình AR . ( p )

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Tôi nghĩ thật công bằng khi nói rằng thực tế phổ biến khi xử lý các quan sát tại các điểm thời gian không đều là xây dựng một mô hình ngẫu nhiên thời gian liên tục.


1
GARCH không phải là một quá trình biến động ngẫu nhiên. Các vol trong GARCH hoàn toàn được xác định cho giai đoạn này bởi các quan sát trong các giai đoạn trước.
Aksakal

11

Đối với chuỗi thời gian cách nhau không đều, thật dễ dàng để xây dựng bộ lọc Kalman .

Có một bài viết làm thế nào để chuyển ARIMA thành dạng không gian trạng thái ở đây

Và một bài báo so sánh Kalman với GARCH tại đây(1)

(1) Choudhry, Taufiq và Wu, Hao (2008)
Khả năng dự báo của phương pháp lọc GARCH vs Kalman: bằng chứng từ phiên bản beta thay đổi theo thời gian hàng ngày của Vương quốc Anh.
Tạp chí Dự báo , 27, (8), 670-689. (đổi: 10.1002 / cho.1096).


Xin lỗi, tôi không có quyền truy cập vào bài báo cuối cùng đó, bạn có thể giúp tôi không?
Quartz

2
Tôi đã thêm trích dẫn để dễ tìm - cũng có một bản in sẵn ở đây: eprints.soton.ac.uk/147383
bdecaf

Bài viết về việc chuyển ARIMA vào không gian trạng thái dường như có một liên kết bị hỏng.
ofey73

9

Khi tôi đang tìm cách đo lượng dao động trong dữ liệu được lấy mẫu bất thường, tôi đã xem qua hai bài báo về làm mịn theo cấp số nhân cho dữ liệu bất thường của Cipra [ 1 , 2 ]. Chúng xây dựng thêm về các kỹ thuật làm mịn của Brown, Winters và Holt (xem mục nhập Wikipedia cho Làm mịn theo cấp số nhân ) và trên một phương pháp khác của Wright (xem bài viết để tham khảo). Các phương pháp này không giả định nhiều về quy trình cơ bản và cũng hoạt động đối với dữ liệu hiển thị biến động theo mùa.

Tôi không biết liệu có bất kỳ thứ gì được tính là "tiêu chuẩn vàng" hay không. Với mục đích riêng của mình, tôi quyết định sử dụng phương pháp làm mịn theo cấp số nhân hai chiều (đơn) theo phương pháp của Brown. Tôi có ý tưởng cho việc làm trơn tru hai cách đọc tóm tắt cho một bài viết của sinh viên (mà bây giờ tôi không thể tìm thấy).


7

Việc phân tích chuỗi thời gian được lấy mẫu bất thường có thể khó khăn, vì không có nhiều công cụ có sẵn. Đôi khi thực hành là áp dụng các thuật toán thông thường và hy vọng điều tốt nhất. Đây không hẳn là cách tiếp cận tốt nhất. Những lần khác, mọi người cố gắng nội suy dữ liệu trong các khoảng trống. Tôi thậm chí đã thấy các trường hợp khoảng trống được lấp đầy với các số ngẫu nhiên có cùng phân phối với dữ liệu đã biết. Một thuật toán dành riêng cho chuỗi được lấy mẫu không đều là Biểu đồ chu kỳ Oliver-Scargle đưa ra biểu đồ (nghĩ phổ công suất) cho chuỗi thời gian được lấy mẫu không đều. Oliver-Scargle không yêu cầu bất kỳ "điều hòa khoảng cách" nào.


3

Nếu bạn muốn mô hình miền thời gian "cục bộ" - trái với ước tính các hàm tương quan hoặc phổ công suất), hãy nói để phát hiện và mô tả các xung, nhảy và tương tự - thì thuật toán Bayesian Block có thể hữu ích. Nó cung cấp một biểu diễn hằng số piecewise tối ưu của chuỗi thời gian trong bất kỳ chế độ dữ liệu nào và với việc lấy mẫu cách đều nhau (không đồng đều). Xem

"Các nghiên cứu về phân tích chuỗi thời gian thiên văn. VI. Các đại diện khối Bayes", Scargle, Jeffrey D.; Norris, Jay P.; Jackson, Brad; Tưởng, James, Tạp chí Vật lý thiên văn, Tập 764, 167, 26 trang (2013). http://arxiv.org/abs/1207.5578


2

RJMartin, "Tín hiệu được lấy mẫu bất thường: Lý thuyết và kỹ thuật phân tích", luận án tiến sĩ, UCL, 1998, có sẵn trực tuyến. Chương 4 đề cập đến các mô hình tự phát và phát triển chủ đề từ quan điểm thời gian liên tục, như các bài viết khác đã nói.


1

Mục 4.10 của J.Durbin, SJKoopman, Phân tích chuỗi thời gian theo phương pháp không gian nhà nước , phiên bản 2, 2012, được dành cho mô hình hóa trong trường hợp mất tích quan sát.


1

Trong dữ liệu phân tích dữ liệu không gian hầu hết thời gian được lấy mẫu không đều trong không gian. Vì vậy, một ý tưởng sẽ là xem những gì được thực hiện ở đó và thực hiện ước lượng variogram, kuceing, v.v. cho miền "thời gian" một chiều. Các biến thể có thể thú vị ngay cả đối với dữ liệu chuỗi thời gian cách đều đặn, vì nó có các thuộc tính khác với chức năng tự tương quan, và được xác định và có ý nghĩa ngay cả đối với dữ liệu không cố định.

Đây là một tờ giấy (tiếng Tây Ban Nha) và đâymột tờ giấy khác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.