Để đặt câu hỏi của tôi vào bối cảnh, tôi là một nhà vật lý nhưng bị hạn chế tiếp xúc với số liệu thống kê và những gì tôi đã học được về nó đã hơn 30 năm trước.
Tôi đang cố gắng tìm hiểu về khối bootstrapping vì kỹ thuật đó có thể phù hợp để giải quyết vấn đề mà tôi đang làm việc. Tôi có thể tìm thấy rất nhiều bài báo / sách / thông tin về toán học của bootstrapping nhưng trước tiên tôi muốn tìm một mô tả chung về quá trình bootstrapping trước khi 'mạo hiểm' vào các vấn đề như di chuyển khối bootstrapping, bootstrapping khối, bootstrapping khối , blocklengths, sampleize, v.v.
Tôi có dữ liệu tương quan chồng chéo, 5 biến (cột) bằng 10000 quan sát (hàng) mà tôi muốn giảm xuống còn khoảng 100 hàng dữ liệu. Dữ liệu là một khoảng thời gian, nhưng không liên tục và cũng có thể có dữ liệu từ các vị trí khác nhau, điều đó có nghĩa là bạn có thể có dữ liệu khác nhau cùng một lúc (nếu đó là vấn đề đối với chặn bootstrapping, tôi có thể xóa dữ liệu 'trùng lặp' đúng giờ). Chặn bootstrapping sẽ cho phép tái tạo sự tương quan của dữ liệu.
Mục đích cuối cùng là giảm tập dữ liệu xuống ~ 100 hàng dữ liệu sao cho cả pdf và cdf của tập dữ liệu đầy đủ và tập dữ liệu giảm là như nhau (trong phạm vi lỗi tối thiểu vẫn được xác định) cho cả 5 biến.
Câu hỏi: 1) Chặn bootstrapping có thể làm điều này không? 2) Quá trình từng bước này được thực hiện là gì? Tôi không mong đợi bất cứ ai sẽ viết toàn bộ quá trình chi tiết ở đây, nhưng có lẽ ai đó đã đặt một video youtube hoặc 'bootstrapping cho người giả' ngoài kia mà tôi có thể bắt đầu.
Tôi đã xem xét các câu hỏi tương tự về khối bootstrapping ở đây và có một câu hỏi về "Tài nguyên để tìm hiểu về khối bootstrap trong phân tích chuỗi thời gian", nhưng các tài liệu tham khảo trong các câu trả lời cho rằng tôi vẫn phải nắm vững kiến thức thống kê.