Rất có thể mẫu bootstrap hoàn toàn giống với mẫu ban đầu


9

Chỉ muốn kiểm tra một số lý do.

Nếu mẫu ban đầu của tôi có kích thước và tôi khởi động nó, thì quá trình suy nghĩ của tôi là như sau:n

n-11n là cơ hội của bất kỳ quan sát nào được rút ra từ mẫu ban đầu. Để đảm bảo bản vẽ tiếp theo không phải là quan sát được lấy mẫu trước đó, chúng tôi giới hạn kích thước mẫu là . Vì vậy, chúng tôi nhận được mô hình này:n1

1n1n11n21n(n1)=1n!.

Điều này có đúng không? Tôi vấp ngã tại sao nó không thể thay vào đó.(1n)n


1
Tôi không chắc là tôi đang theo dõi bạn. Tại sao bạn muốn "đảm bảo lần rút tiếp theo không phải là mẫu trước"? Trong bootstrapping, ý tưởng là lấy mẫu với sự thay thế. Đó là, bạn thực sự muốn có khả năng là lần rút tiếp theo giống như lần bạn đã vẽ.
gung - Phục hồi Monica

Nhưng điều đó có nghĩa là mẫu bootstrapping không giống với mẫu ban đầu?
Jayant.M

Tôi không theo bạn. Bạn không nhất thiết muốn mẫu ủng giống hệt mẫu của bạn, bạn chỉ muốn coi mẫu là mẫu của dân số.
gung - Phục hồi Monica

1
Vì vậy, câu hỏi của tôi là cơ hội mà mẫu bootstrap giống với mẫu ban đầu. Tôi quan tâm đến việc bootstrap giống hệt với mẫu
Jayant.M

Xin lỗi nếu câu hỏi của tôi không rõ ràng!
Jayant.M

Câu trả lời:


17

Lưu ý rằng tại mỗi vị trí quan sát ( ), chúng tôi có thể chọn bất kỳ của quan sát, vì vậy có resamples thể (giữ trật tự mà chúng được rút ra) trong đólà "cùng một mẫu" (nghĩa là chứa tất cả quan sát ban đầu không lặp lại; tài khoản này cho tất cả các cách đặt hàng mẫu mà chúng tôi đã bắt đầu).n n n n ! ni=1,2,...,nnnnn!n

Ví dụ: với ba quan sát, a, b và c, bạn có 27 mẫu có thể:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

Sáu trong số đó chứa một trong mỗi a, b và c.

Vì vậy, là xác suất lấy lại mẫu ban đầu.n!/nn

Ngoài ra - một xấp xỉ nhanh chóng của xác suất:

Hãy xem xét rằng :

2π nn+12enn!e nn+12en

vì thế

2π n12enn!/nne n12en

Với giới hạn dưới là giới hạn thông thường được đưa ra cho xấp xỉ Stirling (có sai số tương đối thấp cho lớn ).n

[Gosper đã đề nghị sử dụng sẽ mang lại xấp xỉ cho xác suất này , hoạt động hợp lý xuống tới hoặc thậm chí xuống tùy thuộc vào mức độ nghiêm ngặt của tiêu chí của bạn.]n!(2n+13)πnnen(2n+13)πenn=3n=1


(Trả lời nhận xét :) Xác suất không nhận được một quan sát cụ thể trong một mẫu lại nhất định là mà đối với lớn là xấp xỉ .ne-1(11n)nne1

Để biết chi tiết, xem
tại sao trung bình mỗi mẫu bootstrap chứa khoảng hai phần ba quan sát?


Cảm ơn bạn! như một điểm quan tâm, cơ hội không nhận được một mục cụ thể trong một mẫu là gì? ví dụ với việc phân phối bạn đã đưa ra, có 8/27 cơ hội không nhận được mẫu vớiaa,b,ca
Jayant.M

1
Điều đó đã được đề cập trong các câu trả lời khác trên trang web nhưng tôi đã thêm nó ở trên (một thời gian ngắn).
Glen_b -Reinstate Monica

1
Vì vậy, đây là xác suất để lấy một mẫu là hoán vị của mẫu ban đầu. Thay vào đó, xác suất nhận được chính xác cùng một chuỗi như trong mẫu ban đầu (do đó, các phần tử giống nhau theo cùng một thứ tự) là . Đúng? (1n)n
DeltaIV

1
@deltaiv vâng, chỉ có một trong sốsắp xếp theo thứ tự ban đầu. n!
Glen_b -Reinstate Monica

1
Không phải xấp xỉ của Gosper hoạt động tốt thậm chí xuống tới , không chỉ xuống ? Tôi nghĩ rằng 0,499 (cho ) là một xấp xỉ khá tốt với 0,5 và 0,996 (đối với ) cũng khá gần với 1,0. n = 3 n = 2 n = 1n=1n=3n=2n=1
Karl Ove Hufthammer
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.