Giả sử bạn có tập huấn luyện gồm cặp ví dụ .Tn(yi,x⃗ i)
Một bootstrap bình thường là một tập hợp gồm cặp ví dụ , trong đó là một chuỗi gồm số nguyên ngẫu nhiên được lấy mẫu thống nhất từ 1 đến . Cụ thể, lưu ý rằng mọi ví dụ trong hoàn toàn giống với một trong các ví dụ từ và một số ví dụ được lặp lại. Nhưng điều này hơi lạ, đặc biệt là khi biến phản hồi liên tục, bởi vì nếu chúng ta lấy mẫu lại dân số ban đầu, chúng ta gần như chắc chắn sẽ không nhận được một bản sao chính xác , trong khi bootstrap có thể có nhiều.Bn(yri,x⃗ ri)rinnBT
Để tránh trùng lặp, chúng ta cần các ví dụ về không phải là bản sao carbon của các ví dụ từ , mà là các ví dụ tổng hợp trông giống như những gì chúng ta sẽ lấy từ dân số ban đầu. Điều này đòi hỏi phải đưa ra một giả định về sự phân bố dân số ban đầu.B TT
Nếu chúng ta giả sử tính đồng nhất và khớp một mô hình tuyến tính với có phần dư thì chúng ta có thể xây dựng các ví dụ tổng hợp mới bằng cách thay thế phần dư được trang bị từ mỗi ví dụ bằng phần dư từ một ví dụ đào tạo khác . Nếu phần dư thực sự là iid, sẽ không có vấn đề gì khi đổi cái này sang cái khác. Chúng tôi thực hiện thay thế này bằng cách trừ phần dư tìm thấy cho ví dụ đào tạo và thêm phần dư cho một số ví dụ khác:Tei ( y i , → x i )(yi,x⃗ i)
y∗i=yri−eri+er′i(1)
Trong đó và là hai mô hình độc lập và khác nhau. Sau đó chúng ta có thể tạo bootstrap theo cách thông thường:rir′i
B={(y∗i,x⃗ i)}ni=1(2)
Đây được gọi là bootstrap dư và có thể được coi là chọn phần dư mới từ hàm phân phối theo kinh nghiệm của phần dư.
Để làm giảm các giả định iid và homoskedasticity hơn nữa, chúng ta có thể sử dụng bootstrap hoang dã , trong đó chúng ta tính toán biến phản ứng mới thậm chí nhiều hơn một cách ngẫu nhiên bằng cách nhân số dư ngẫu nhiên được chọn với một biến ngẫu nhiên khác .vi
y∗i=yri−eri+vier′i(3)
Thường thì phân phối chuẩn được sử dụng nhưng các lựa chọn khác là có thể. Ví dụ: đôi khi được chọn đơn giản với xác suất bằng nhau từ , chỉ đơn giản là lật ngẫu nhiên dấu hiệu một nửa thời gian, buộc phân phối dư phải đối xứng. Vấn đề là lấy các ví dụ đào tạo gần với những gì chúng ta đã rút ra từ dân số ban đầu mà không cần sao chép nhân tạo được giới thiệu bởi bootstrap.vi∼N(0,1)vi{−1,1}