Chọn thích ứng số lượng bản sao bootstrap


8

Như với hầu hết các phương pháp Monte Carlo, quy tắc cho bootstrapping là số lần sao chép càng lớn, lỗi Monte Carlo càng thấp. Nhưng có lợi nhuận giảm dần, vì vậy sẽ không có ý nghĩa khi chạy càng nhiều bản sao càng tốt.

Giả sử bạn muốn đảm bảo rằng ước tính của bạn θ^ của một số lượng nhất định θ nằm trong ε dự toán θ~ mà bạn sẽ nhận được với vô cùng nhiều lần nhắc lại. Ví dụ: bạn có thể muốn chắc chắn một cách hợp lý rằng hai vị trí thập phân đầu tiên của θ^ không sai do lỗi Monte Carlo, trong trường hợp này ε=.005 . Có một quy trình thích ứng mà bạn có thể sử dụng để tiếp tục tạo các bản sao bootstrap, kiểm tra θ^ và dừng theo một quy tắc như, giả sử, |θ^θ~|<ε với độ tin cậy 95%?

NB Mặc dù các câu trả lời hiện có hữu ích, tôi vẫn muốn xem sơ đồ để kiểm soát xác suất |θ^θ~|<ε .


Tôi phản đối việc gọi bootstrap là phương thức Monte Carlo. Mặc dù thường không cần các phương pháp Monte Carlo để có được xấp xỉ tốt cho các ước tính bootstrap vì phép liệt kê là không khả thi.
Michael R. Chernick

Tôi không chắc chắn chính xác những gì bạn đang yêu cầu. Nhưng thường thì rất khó để biết trước bạn cần bao nhiêu lần sao chép bootstrap để thực hiện xấp xỉ Monte Carlo với ước tính bootstrap gần với ước tính bootstrap thực tế. Tôi đã đề nghị làm một cái gì đó giống như những gì bạn đang đề nghị. Đó sẽ là thêm các bản sao cho đến khi thay đổi trong ước tính là nhỏ. Đây sẽ là một dấu hiệu của sự hội tụ.
Michael R. Chernick

@MichaelCécick "Tôi không chắc chính xác những gì bạn đang hỏi." - Tôi có thể làm gì để giúp làm rõ nó?
Kodiologist

Khi bạn nói về lựa chọn thích ứng, bạn có nghĩa là những gì tôi đang đề xuất? Đó là tiếp tục thực hiện các bản sao bootstrap cho đến khi hai ước tính liên tiếp rất gần nhau (giả sử sự khác biệt tuyệt đối nhỏ hơn một được chỉ định ). ϵ
Michael R. Chernick

@MichaelChernick Tôi không nghĩ rằng nhìn vào sự khác nhau giữa liên tiếp s sẽ là đủ để có được . Nhưng tôi không chắc lắm. θ~|θ^θ~|<ε
Kodiologist

Câu trả lời:


3

Nếu ước tính của trên các bản sao được phân phối bình thường, tôi đoán bạn có thể ước tính lỗi trên từ độ lệch chuẩn :θσ^θ^σ

σ^=σn

sau đó bạn chỉ có thể dừng khi .1.96σ^<ϵ

Hay tôi đã hiểu nhầm câu hỏi? Hay bạn muốn có một câu trả lời mà không giả sử tính bình thường và sự hiện diện của sự tự kỷ đáng kể?


Sẽ thật tốt nếu không phải giả định tính bình thường, nhưng chúng tôi chắc chắn có thể giả định rằng các bản sao bootstrap được chọn độc lập, nếu đó là loại phụ thuộc mà bạn có nghĩa là tự động tương quan.
Kodiologist

Nếu chúng ta không giả định tính bình thường, chúng ta thậm chí không thể chắc chắn rằng giá trị trung bình là một ước tính tốt cho theta. Tôi tin rằng chúng ta cần nhiều giả thuyết hơn để đề xuất giải pháp ...
fabiob

Để rõ ràng, điều gì, chính xác, bạn đang giả sử là bình thường? Văn bản câu trả lời của bạn cho biết "các bản sao được phân phối bình thường", nhưng mỗi bản sao là một mẫu có cùng kích thước với mẫu ban đầu. Tôi không biết ý nghĩa của việc một bộ sưu tập mẫu được phân phối bình thường.
Kodiologist

Tôi giả sử là bình thường phân phối của ước tính số lượng bạn quan tâm, mà bạn thực hiện trên bản sao . Tôi sẽ chỉnh sửa công thức của tôi không rõ ràng. θii
fabiob

3
cuối cùng cũng nhận thấy câu trả lời của tôi và michael giống nhau như thế nào nếu bạn thay thế C-> và B -> , gợi ý cách "xác định" C. bạn có thể lấy phương sai của hoặc gấp đôi số đó nếu bạn muốn được bảo thủ Bạn có đồng ý (hoặc nghĩ rằng tôi đang thiếu một cái gì đó)? σ2nθi
fabiob

2

Trên trang 113-114 của phiên bản đầu tiên của cuốn sách Phương pháp Bootstrap của tôi: Hướng dẫn của một học viên Wiley (1999) Tôi thảo luận về các phương pháp xác định số lần sao chép bootstrap cần thực hiện khi sử dụng xấp xỉ Monte Carlo.

Tôi đi vào chi tiết về một thủ tục do Hall được mô tả trong cuốn sách The Bootstrap và Edgeworth Expansion, Springer-Verlag (1992). Ông chỉ ra rằng khi cỡ mẫu n lớn và số lần sao chép bootstrap B lớn thì phương sai của ước lượng bootstrap là C / B trong đó C là hằng số chưa biết không phụ thuộc vào n hoặc B. Vì vậy, nếu bạn có thể xác định C hoặc ràng buộc nó ở trên, bạn có thể xác định một giá trị cho B làm cho sai số của ước tính nhỏ hơn mà bạn chỉ định trong câu hỏi của mình.ϵ

Tôi mô tả một tình huống trong đó C = 1/4. Nhưng nếu bạn không biết giá trị C là bao nhiêu thì bạn có thể sử dụng cách tiếp cận mà bạn mô tả khi bạn lấy B = 500 nói và sau đó nhân đôi nó lên 1000 và so sánh sự khác biệt trong các ước tính bootstrap đó. Quy trình này có thể được lặp đi lặp lại cho đến khi sự khác biệt là nhỏ như bạn muốn.

Một ý tưởng khác được đưa ra bởi Efron trong bài viết "Khoảng tin cậy bootstrap tốt hơn (có thảo luận)", (1987) Tạp chí của Hiệp hội Thống kê Hoa Kỳ Vol. 82 trang 171-200.


À, bởi "hai ước tính liên tiếp" Tôi nghĩ bạn có ý gì đó giống như ước tính từ sao chép 1,002 so với ước tính từ sao chép 1,003. So sánh ước tính từ tất cả 500 lần lặp lại đầu tiên với 500 lần lặp lại hoặc 500 lần đầu tiên là trực quan hơn. θθ
Kodiologist

Tôi đã thấy Efron (1987) trước đây, nhưng phần nào giải quyết câu hỏi về số lượng bản sao bootstrap?
Kodiologist

Trong cuốn sách của tôi, tôi đã đề cập rằng trong Efron (1967) và Gian hàng và Sarkar (1998), họ chỉ ra rằng sau một số lần lặp (lớn) cụ thể, lỗi trong ước tính bootstrap bị chi phối bởi lỗi do sử dụng phân phối theo kinh nghiệm (như một xấp xỉ với phân bố dân số) làm cho sai số trong xấp xỉ Monte Carlo nhỏ. Tôi đã không trích dẫn trang cụ thể hoặc các trang nơi điều này được thảo luận.
Michael R. Chernick

Trong phần bình luận ở trên tôi có nghĩa là Efron (1987).
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.