Làm thế nào để bạn thực hiện bootstrapping với dữ liệu chuỗi thời gian?


33

Gần đây tôi đã tìm hiểu về việc sử dụng các kỹ thuật bootstrapping để tính toán các lỗi tiêu chuẩn và khoảng tin cậy cho các công cụ ước tính. Điều tôi học được là nếu dữ liệu là IID, bạn có thể coi dữ liệu mẫu là dân số và lấy mẫu với sự thay thế và điều này sẽ cho phép bạn có được nhiều mô phỏng thống kê kiểm tra.

Trong trường hợp chuỗi thời gian, rõ ràng bạn không thể làm điều này vì khả năng tự tương quan có khả năng tồn tại. Tôi có một chuỗi thời gian và muốn tính giá trị trung bình của dữ liệu trước và sau một ngày cố định. Có một cách chính xác để làm như vậy bằng cách sử dụng một phiên bản sửa đổi của bootstrapping?


16
Thuật ngữ tìm kiếm chính: Chặn bootstrap.
Đức hồng y

Câu trả lời:


26

Như @cardinal chỉ ra, các biến thể trên 'khối bootstrap' là một cách tiếp cận tự nhiên. Ở đây, tùy thuộc vào phương pháp, bạn chọn các chuỗi thời gian, chồng chéo hoặc không và có độ dài cố định hoặc ngẫu nhiên, có thể đảm bảo tính ổn định trong các mẫu ( Politis và Romano, 1991 ) sau đó ghép chúng lại với nhau để tạo chuỗi thời gian được ghép lại trên đó bạn tính toán thống kê của bạn. Bạn cũng có thể cố gắng xây dựng các mô hình của các phụ thuộc tạm thời, dẫn đến các phương pháp Markov, các sàng tự động và các phương pháp khác. Nhưng khối bootstrapping có lẽ là cách dễ nhất để thực hiện.

Gonçalves và Pol viêm (2011) là một đánh giá rất ngắn với các tài liệu tham khảo. Một điều trị chiều dài cuốn sách là Lahiri (2010) .


@statnub Nếu điều này liên quan đến câu hỏi can thiệp bán hàng hàng tuần trước đó của bạn, hãy lưu ý rằng bạn sẽ tự khởi động nếu bạn không tin tưởng vào các giả định mô hình mà bạn đang triển khai ở đó. Sử dụng mô hình chuỗi thời gian chính đáng ở vị trí đầu tiên sẽ giúp giảm thiểu rủi ro của những thứ chỉ ra loại bootstrapping này ...
liên hợp chiến binh

6
Câu trả lời tốt. Hãy để tôi thêm rằng bạn có thể sử dụng tsboottrong bootgói trong R để làm điều này.
MånsT

@ MånsT Đẹp. Tôi đã không biết về gói đó.
liên hợp chiến binh

5

Phương pháp lấy mẫu lại được giới thiệu trong Efron (1979) được thiết kế cho iid dữ liệu đơn biến nhưng dễ dàng được mở rộng thành dữ liệu đa biến. Như đã thảo luận trong. Nếu là một mẫu vectơ, để duy trì cấu trúc hiệp phương sai của dữ liệu trong mẫu. Không rõ ràng ngay lập tức liệu người ta có thể lấy mẫu lại một chuỗi thời gian . Một chuỗi thời gian về cơ bản là một mẫu có kích thước 1 từ một quá trình ngẫu nhiên. Lấy mẫu lại một mẫu là mẫu ban đầu, vì vậy người ta không học được gì bằng cách lấy mẫu lại. Do đó, việc lấy lại một chuỗi thời gian đòi hỏi những ý tưởng mới.x1,···,xnx1,x2,···,xn

Lấy mẫu dựa trên mô hình dễ dàng được chấp nhận theo chuỗi thời gian. Các mẫu được lấy bằng cách mô phỏng mô hình chuỗi thời gian. Ví dụ: nếu mô hình là ARIMA (p, d, q), thì các mô hình của mô hình ARIMA (p, q) với MLE (từ chuỗi khác biệt) của hệ số trung bình tự động và di chuyển và phương sai nhiễu. Các mẫu là các chuỗi tổng một phần của quy trình ARIMA (p, q) mô phỏng.

Việc lấy mẫu lại chuỗi thời gian không có mô hình được thực hiện bằng cách lấy lại khối, còn được gọi là khối bootstrap, có thể được thực hiện bằng cách sử dụng chức năng tsboot trong gói khởi động của R. Ý tưởng là chia chuỗi thành các khối quan sát liên tiếp có độ dài gần bằng nhau, để lấy mẫu lại khối thay thế, và sau đó dán các khối lại với nhau. Ví dụ: nếu chuỗi thời gian có độ dài 200 và một khối sử dụng 10 khối có độ dài 20, thì các khối là 20 quan sát đầu tiên, 20 tiếp theo, v.v. Một mẫu có thể là khối thứ tư (quan sát 61 đến 80), sau đó là khối cuối cùng (quan sát từ 181 đến 200), sau đó là khối thứ hai (quan sát 21 đến 40), sau đó là khối thứ tư, và cứ thế cho đến khi có 10 khối trong mẫu lại.


1
Có các hình thức khác của phương thức bootstrap khối bao gồm bootstrap khối chồng chéo và bootstrap khối tròn được mô tả chi tiết trong cuốn sách "Phương pháp lấy mẫu lại dữ liệu phụ thuộc" của Lahiri (2003). Những phương pháp này được áp dụng cho chuỗi thời gian đứng yên.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.