Sự hiểu biết của tôi về cách tiếp cận bootstrap dựa trên khuôn khổ của Wasserman (gần như nguyên văn):
Hãy là một thống kê ( X i là mẫu iid rút ra từ phân phối F ). Giả sử chúng ta muốn ước tính V F ( T n ) - phương sai của T n cho F .
Cách tiếp cận bootstrap theo hai bước sau:
Ước tính với V F ( T n ) , nơi F là hàm phân phối thực nghiệm.
Xấp xỉ sử dụng mô phỏng.
Tôi có hiểu chính xác rằng mô phỏng ở bước 2 có thể được thay thế bằng một phép tính chính xác không, ngoại trừ việc nó không khả thi đối với các giá trị thực tế hữu ích của ? Dưới đây là suy nghĩ của tôi: V F chính xác bằng một tách rời của T n ( X 1 , . . . , X n ) d F ( X 1 ) d F ( X 2 ) . . . d F ( X n ) . là một bước chức năng, với một hữu hạn sốnbước; vì vậy chúng tôi có thể bỏ qua tất cả các điểm ngoại trừnđiểm nơid F (x)có khác không tin đại chúng. Vì vậy, tích phân chính xác bằng tổngnn số hạng. Khinvượt quá 14, một phép tính trực tiếp đơn giản là không thể.
Nhưng tất cả những gì chúng tôi đang cố gắng làm là tính một tích phân. Tại sao không thay thế mô phỏng bootstrap brute-force bằng bất kỳ thuật toán số truyền thống nào để lấy tích phân? Nó sẽ không dẫn đến độ chính xác cao hơn nhiều cho cùng một thời gian tính toán?
Ngay cả một cái gì đó đơn giản như phân chia không gian mẫu trong các phần (có thể với khối lượng nhỏ hơn trong đó thống kê mẫu thay đổi nhanh hơn) và ước tính giá trị của thống kê trong mỗi phần bằng cách sử dụng điểm giữa, dường như tốt hơn bootstrap mù.
Tôi đang thiếu gì?
Có lẽ bootstrap hoạt động tốt và nhanh đến mức không cần phải làm gì phức tạp hơn? (Ví dụ: nếu mất độ chính xác ở bước 1 lớn hơn nhiều so với bước 2, thì các cải tiến cho bước 2 là khá vô ích.)