Bootstrapping một mẫu từ một dân số hữu hạn

Ai đó có thể chỉ cho tôi một số tài liệu tham khảo cho lý thuyết về bootstrapping một mẫu lấy từ dân số có kích thước đã biết không?

Tôi thường sử dụng Bootstrap để tính khoảng tin cậy của mẫu khi kích thước quần thể được coi là lớn hơn mẫu (do đó, lựa chọn ngẫu nhiên với sự lặp lại sẽ mô phỏng tốt quá trình lấy mẫu).

Bây giờ hãy nói rằng tôi biết dân số là 1000 và tôi đã lấy mẫu 800 (và giả sử việc lấy mẫu trên thực tế là ngẫu nhiên). Lựa chọn ngẫu nhiên với sự lặp lại dường như không phù hợp. Theo nguyên tắc pigeonhole, nếu tôi thực sự lấy một mẫu ngẫu nhiên có kích thước 800 khác, đảm bảo rằng ít nhất 600 giá trị sẽ giống với mẫu ban đầu, một cái gì đó bootstrap truyền thống không thể sao chép (và có thể bỏ lỡ rất nhiều).

Giải pháp nào? Tôi nghĩ:

Lấy mẫu 1000 với sự lặp lại, sau đó chọn ngẫu nhiên 800 (dường như là một cách tiếp cận tương đương với bootstrap truyền thống)
Mẫu 600 không lặp lại, hơn mẫu 200 hơn sử dụng tất cả 800 mẫu có lặp lại. Điều này sẽ giải thích cho hiệu ứng tôi đã mô tả trước đó.

Bất kỳ suy nghĩ về những gì là tốt và xấu với những phương pháp tiếp cận? Hoặc bất kỳ phương pháp thay thế?

— Inox
nguồn

Lấy mẫu bootstrap giống với quá trình lấy mẫu dữ liệu từ dân số. Trong trường hợp dân số hữu hạn, bạn đã lấy mẫu $f$ ra khỏi dân số $N$ , I E $n = fN$ các trường hợp. Có hai vấn đề khi sử dụng bootstrap trong trường hợp như vậy: (1) nếu bạn đã sử dụng bootstrap truyền thống, bạn sẽ lấy mẫu với thay thế thay vì không thay thế, (2) nếu bạn lấy mẫu mà không thay thế $fn$ trường hợp, sau đó bạn kết thúc với mẫu nhỏ hơn $n$ . Kịch bản đầu tiên là một ý tưởng tồi vì trong trường hợp như vậy, bootstrap sẽ không giống với quy trình lấy mẫu ban đầu. Để sử dụng bootstrap trong trường hợp dân số hữu hạn, bạn có ba lựa chọn thay thế:

Mẫu không có mẫu thay thế kích thước $fn$ và sau đó hủy bỏ kết quả. Việc tìm ra yếu tố thay đổi kích thước phù hợp có thể phức tạp hơn sau đó có vẻ phức tạp, vì vậy đây có thể không phải là sự thay thế tốt nhất.
Mẫu đầu tiên không thay thế $N-n$ trường hợp ra khỏi mẫu của bạn, nối chúng với mẫu, và sau đó lấy mẫu mà không thay thế $n$ trường hợp ra khỏi nó. Điều này được gọi là bootstrap gương .
Mẫu đầu tiên thay thế $N$ trường hợp ra khỏi mẫu của bạn, và sau đó lấy mẫu từ nó $n$ trường hợp không thay thế . Điều này được gọi là bootstrap siêu phổ biến .

Để tìm hiểu thêm về các phương pháp đó, bạn có thể kiểm tra các tài nguyên sau:

Davison, AC & Hinkley, DV (2009). Phương pháp Bootstrap và ứng dụng của họ. New York, NY: Nhà xuất bản Đại học Cambridge.

Người trông nom, RR (1992). Một quy trình lấy mẫu lại cho dữ liệu khảo sát phức tạp. Tạp chí của Hiệp hội Thống kê Hoa Kỳ, 87 (419), 755-765.

Người trông nom, RR (1992). So sánh ba phương pháp bootstrap cho dữ liệu khảo sát. Tạp chí Thống kê Canada, 20 (2), 135-154.

— Tim
nguồn

Cảm ơn rất nhiều cho câu trả lời và các tài liệu tham khảo. Tôi đoán rằng tôi đã không đi quá xa câu trả lời, và chắc chắn sẽ có lợi rất nhiều từ các tài liệu tham khảo.

— Inox

@Inox vâng, bạn đã rất thân thiết :)

— Tim