Hãy khái quát hóa, để tập trung vào mấu chốt của vấn đề. Tôi sẽ đánh vần những chi tiết nhỏ nhất để không còn nghi ngờ gì nữa. Việc phân tích chỉ yêu cầu như sau:
Giá trị trung bình số học của một tập hợp các sốz1,…,zm được xác định là
1m(z1+⋯+zm).
Kỳ vọng là một toán tử tuyến tính. Nghĩa là, khi là các biến ngẫu nhiên và α i là các số, thì kỳ vọng của một tổ hợp tuyến tính là sự kết hợp tuyến tính của các kỳ vọng,Zi,i=1,…,mαi
E(α1Z1+⋯+αmZm)=α1E(Z1)+⋯+αmE(Zm).
Hãy là một mẫu ( B 1 , ... , B k ) thu được từ một tập dữ liệu x = ( x 1 , ... , x n ) bằng cách lấy k yếu tố thống nhất từ x với thay thế. Hãy m ( B ) là trung bình cộng của B . Đây là một biến ngẫu nhiên. Sau đóB(B1,…,Bk)x=(x1,…,xn)kxm(B)B
E(m(B))=E(1k(B1+⋯+Bk))=1k(E(B1)+⋯+E(Bk))
tiếp theo là tuyến tính của kỳ vọng. Vì các yếu tố của đều thu được theo cùng một kiểu, nên tất cả chúng đều có cùng kỳ vọng, b nói:Bb
E(B1)=⋯=E(Bk)=b.
Điều này đơn giản hóa những điều đã nói ở trên
E ( m ( B ) ) = 1k( B + b + ⋯ + b ) = 1k( k b ) = b .
Theo định nghĩa, kỳ vọng là tổng giá trị có trọng số xác suất. Vì mỗi giá trị của được giả sử có cơ hội bằng 1 / n được chọn,X1 / n
E (m(B))=b= E ( B1) = 1nx1+ ⋯ + 1nxn= 1n( x1+ ⋯ + xn) = x¯,
trung bình số học của dữ liệu.
Để trả lời câu hỏi, nếu người ta sử dụng trung bình dữ liệu để ước tính trung bình dân số, thì trung bình bootstrap (là trường hợp k = n ) cũng bằng ˉ x , và do đó giống hệt như một công cụ ước tính của trung bình dân số.x¯k = nx¯
Đối với thống kê không phải là hàm tuyến tính của dữ liệu, kết quả tương tự không nhất thiết phải giữ. Tuy nhiên, sẽ là sai lầm nếu chỉ thay thế bootstrap có nghĩa là giá trị của thống kê trên dữ liệu: đó không phải là cách bootstrapping hoạt động. Thay vào đó, bằng cách so sánh bootstrap có nghĩa với thống kê dữ liệu, chúng tôi có được thông tin về sự sai lệch của thống kê. Điều này có thể được sử dụng để điều chỉnh thống kê ban đầu để loại bỏ sự thiên vị. Do đó, ước tính điều chỉnh sai lệch do đó trở thành một sự kết hợp đại số của thống kê ban đầu và ý nghĩa bootstrap. Để biết thêm thông tin, hãy tra cứu "BCa" (bootstrap được điều chỉnh và tăng tốc) và "ABC". Wikipedia cung cấp một số tài liệu tham khảo.