Chặn bootstrap cho người mới


9

Để đặt câu hỏi của tôi vào bối cảnh, tôi là một nhà vật lý nhưng bị hạn chế tiếp xúc với số liệu thống kê và những gì tôi đã học được về nó đã hơn 30 năm trước.

Tôi đang cố gắng tìm hiểu về khối bootstrapping vì kỹ thuật đó có thể phù hợp để giải quyết vấn đề mà tôi đang làm việc. Tôi có thể tìm thấy rất nhiều bài báo / sách / thông tin về toán học của bootstrapping nhưng trước tiên tôi muốn tìm một mô tả chung về quá trình bootstrapping trước khi 'mạo hiểm' vào các vấn đề như di chuyển khối bootstrapping, bootstrapping khối, bootstrapping khối , blocklengths, sampleize, v.v.

Tôi có dữ liệu tương quan chồng chéo, 5 biến (cột) bằng 10000 quan sát (hàng) mà tôi muốn giảm xuống còn khoảng 100 hàng dữ liệu. Dữ liệu là một khoảng thời gian, nhưng không liên tục và cũng có thể có dữ liệu từ các vị trí khác nhau, điều đó có nghĩa là bạn có thể có dữ liệu khác nhau cùng một lúc (nếu đó là vấn đề đối với chặn bootstrapping, tôi có thể xóa dữ liệu 'trùng lặp' đúng giờ). Chặn bootstrapping sẽ cho phép tái tạo sự tương quan của dữ liệu.

Mục đích cuối cùng là giảm tập dữ liệu xuống ~ 100 hàng dữ liệu sao cho cả pdf và cdf của tập dữ liệu đầy đủ và tập dữ liệu giảm là như nhau (trong phạm vi lỗi tối thiểu vẫn được xác định) cho cả 5 biến.

Câu hỏi: 1) Chặn bootstrapping có thể làm điều này không? 2) Quá trình từng bước này được thực hiện là gì? Tôi không mong đợi bất cứ ai sẽ viết toàn bộ quá trình chi tiết ở đây, nhưng có lẽ ai đó đã đặt một video youtube hoặc 'bootstrapping cho người giả' ngoài kia mà tôi có thể bắt đầu.

Tôi đã xem xét các câu hỏi tương tự về khối bootstrapping ở đây và có một câu hỏi về "Tài nguyên để tìm hiểu về khối bootstrap trong phân tích chuỗi thời gian", nhưng các tài liệu tham khảo trong các câu trả lời cho rằng tôi vẫn phải nắm vững kiến ​​thức thống kê.


1
Làm thế nào về giới thiệu này ? Nó có phần giới thiệu về bootstrap và sau đó là bootstrap khối.
David G Williams

Câu trả lời:


7

Việc lấy mẫu lại chuỗi thời gian không có mô hình được thực hiện bằng cách ghép lại khối, còn được gọi là khởi động khối, có thể được thực hiện bằng cách sử dụng hàm tsboot trong gói khởi động của R. Ý tưởng là chia chuỗi thành các khối quan sát liên tiếp có độ dài gần bằng nhau, để lấy mẫu lại khối thay thế và sau đó dán các khối lại với nhau. Ví dụ: nếu chuỗi thời gian có độ dài 200 và một khối sử dụng 10 khối có độ dài 20, thì các khối là 20 quan sát đầu tiên, 20 tiếp theo, v.v. Một mẫu có thể là khối thứ tư (quan sát 61 đến 80), sau đó là khối cuối cùng (quan sát từ 181 đến 200), sau đó là khối thứ hai (quan sát 21 đến 40), sau đó là khối thứ tư, và cứ thế cho đến khi có 10 khối trong mẫu lại. Làm thế nào để bạn thực hiện bootstrapping với dữ liệu chuỗi thời gian?


3
Những gì kinh tế giải thích về tăng cường là chính xác nhưng lưu ý rằng mẫu bootstrapping không được sử dụng để giảm tập dữ liệu xuống một tập dữ liệu nhỏ hơn có cùng phân phối cơ bản. (mà bạn nói là mục tiêu của bạn). Bootstrapping được sử dụng để kiểm tra một số giả thuyết bằng cách tạo mẫu bootstrapping và sau đó xem vị trí của thống kê (mẫu đang được thử nghiệm) liên quan đến phân phối theo kinh nghiệm của mẫu bootstrapping. Vì vậy, việc giảm tập dữ liệu thành tập dữ liệu nhỏ hơn không phải là mục tiêu của bstrapping. Nó được sử dụng để kiểm tra giả thuyết theo cách miễn phí theo mô hình.
mlofton
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.