Trước hết: Từ những gì tôi hiểu, phần dư bootstrapping hoạt động như sau:
- Phù hợp với mô hình dữ liệu
- Tính số dư
- Lấy mẫu lại phần dư và thêm chúng vào 1.
- Mô hình phù hợp với tập dữ liệu mới từ 3.
- Lặp lại
n
nhiều lần, nhưng luôn luôn thêm các phần dư được lấy mẫu lại cho phù hợp từ 1.
Điều đó có đúng không?
Những gì tôi muốn làm là một cái gì đó hơi khác nhau:
Tôi muốn ước tính độ không đảm bảo của tham số và dự đoán cho một thuật toán ước tính một số biến môi trường.
Những gì tôi có là một chuỗi thời gian không có lỗi (từ một mô phỏng) của biến đó x_true
, mà tôi thêm một số nhiễu, x_noise
để tạo ra một tập dữ liệu tổng hợp x
. Sau đó, tôi cố gắng tìm các tham số tối ưu bằng cách khớp thuật toán của mình với tổng bình phương sum((x_estimate - x_true)^2)
(! Không x_estimate - x
!) Làm hàm mục tiêu. Để xem thuật toán của tôi hoạt động như thế nào và tạo các mẫu phân phối tham số của tôi, tôi muốn lấy mẫu lại x_noise
, thêm nó vào x_true
, khớp lại mô hình của tôi, rửa sạch và lặp lại. Đó có phải là một cách tiếp cận hợp lệ để đánh giá độ không đảm bảo của tham số? Tôi có thể diễn giải sự phù hợp với các bộ dữ liệu bootstrapping là sự không chắc chắn dự đoán hay tôi phải làm theo quy trình tôi đã đăng ở trên?
/ chỉnh sửa: Tôi nghĩ rằng tôi đã không thực sự làm rõ những gì mô hình của tôi làm. Hãy nghĩ về nó về cơ bản giống như một phương pháp khử nhiễu. Đây không phải là một mô hình dự đoán, đó là một thuật toán cố gắng trích xuất tín hiệu cơ bản của chuỗi dữ liệu môi trường ồn ào.
/ chỉnh sửa ^ 2: Đối với người dùng MATLAB ngoài kia, tôi đã viết ra một số ví dụ hồi quy tuyến tính nhanh và bẩn về ý tôi muốn nói.
Đây là những gì tôi tin rằng bootstrapping của phần dư là (vui lòng sửa cho tôi nếu tôi sai): http://pastebin.com/C0CJp3d1
Đây là những gì tôi muốn làm: http://pastebin.com/mbapsz4c