Bootstrap lặp là gì? Nó được sử dụng như thế nào?

Gần đây tôi đã tình cờ thấy một đề cập đến "bootstrap đôi / ba" hoặc "bootstrap lặp". Theo tôi hiểu, mỗi mẫu bootstrap lại được bootstrapping.

Điểm là gì? Nó được sử dụng như thế nào?

bootstrap

— Tối đa
nguồn

Có rất nhiều biến thể về thuật ngữ với bootstrap (nơi tôi đã thấy một thứ gọi là ba tên khác nhau và tôi đã thấy cùng một tên được sử dụng cho những thứ khác nhau). Bạn có thể chỉ đến nơi bạn nhìn thấy nó?

— Glen_b -Reinstate Monica

@Glen_b Ví dụ ihome.ust.hk/~yfong/iterate.pdf Khá nhiều nỗ lực dường như đã đi vào việc phát triển các thuật toán hiệu quả cho nó. Vì vậy, rõ ràng, nó phải hữu ích cho một cái gì đó. Từ các tài liệu tôi chỉ không thể nhìn thấy những gì mà không thực sự đi sâu vào nó.

— Tối đa

@whuber liên kết tôi với bài viết này trong một câu hỏi không liên quan, nhưng chương 2 giải thích về bootstrapping và lặp lại bootstrapping rất rõ ràng. Tôi đã rất lấy cảm hứng từ nó, tôi đã viết một bài đăng blog nhỏ với một số ví dụ.

— Cam.Davidson.Pilon

Bài báo mà bạn đề cập trong các bình luận đề cập đến Davidson và MacKinnon, những người đưa ra động lực này:

Mặc dù giá trị bootstrap P thường sẽ rất đáng tin cậy, nhưng điều này sẽ không đúng trong mọi trường hợp. Đối với một thử nghiệm tiệm cận, một cách để kiểm tra xem nó có đáng tin hay không chỉ đơn giản là sử dụng bootstrap. Nếu các giá trị P tiệm cận và bootstrap liên quan đến một thống kê kiểm tra nhất định là tương tự nhau, chúng ta có thể khá tự tin rằng giá trị tiệm cận là chính xác một cách hợp lý. Tất nhiên, đã gặp rắc rối khi tính toán giá trị P của bootstrap, chúng tôi có thể muốn sử dụng nó thay vì giá trị tiệm cận.
Tuy nhiên, trong rất nhiều trường hợp, giá trị P tiệm cận và bootstrap khá khác nhau. Khi điều này xảy ra, gần như chắc chắn rằng giá trị P không triệu chứng là không chính xác, nhưng chúng ta không thể chắc chắn rằng giá trị bootstrap là chính xác. Trong bài báo này, chúng tôi thảo luận về các kỹ thuật để tính toán các giá trị P bootstrap đã sửa đổi, nó sẽ có xu hướng tương tự như giá trị P bootstrap thông thường khi đáng tin cậy, nhưng thường chính xác hơn khi không đáng tin cậy. Những kỹ thuật này có liên quan chặt chẽ với bootstrap đôi do Beran (1988) đề xuất ban đầu, nhưng chúng ít tốn kém hơn để tính toán. Trong thực tế, số lượng nỗ lực tính toán vượt quá mức cần thiết để có được các giá trị P bootstrap thông thường gần bằng với số lượng cần thiết để tính toán giá trị sau ở vị trí đầu tiên.

Đó có vẻ là một lý do khá rõ ràng để (i) thực hiện bootstrapping lặp lại và (ii) để cố gắng theo đuổi các phương pháp hiệu quả để thực hiện nó - đó là điều mà bài báo bạn chỉ ra và bài báo này dường như đang cố gắng thực hiện.

(Cho đến nay câu trả lời này chỉ liên quan đến phần 'vấn đề là gì?' Của câu hỏi.)

— Glen_b -Reinstate Monica
nguồn