Tại sao sử dụng bootstrap tham số?

Tôi hiện đang cố gắng để hiểu được một số điều liên quan đến bootstrap tham số. Hầu hết mọi thứ có lẽ là tầm thường nhưng tôi vẫn nghĩ rằng tôi có thể đã bỏ lỡ điều gì đó.

Giả sử tôi muốn có được khoảng tin cậy cho dữ liệu bằng cách sử dụng thủ tục bootstrap tham số.

Vì vậy, tôi có mẫu này và tôi giả sử nó được phân phối bình thường. Sau đó, tôi sẽ ước tính phương sai và có nghĩa là và lấy ước tính phân phối của tôi , rõ ràng chỉ là . $\hat{v}$ $\hat{m}$ $\hat{P}$ $N(\hat{m},\hat{v})$

Thay vì lấy mẫu từ phân phối đó, tôi chỉ có thể tính toán các lượng tử phân tích và được thực hiện.

a) Tôi kết luận: trong trường hợp tầm thường này, bootstrap tham số sẽ giống như tính toán mọi thứ trong một giả định phân phối bình thường?

Vì vậy, về mặt lý thuyết, đây sẽ là trường hợp cho tất cả các mô hình bootstrap tham số, miễn là tôi có thể xử lý các tính toán.

b) Tôi kết luận: sử dụng giả định của một phân phối nhất định sẽ mang lại cho tôi độ chính xác cao hơn trong bootstrap tham số so với phân tích không tham số (tất nhiên nếu nó đúng). Nhưng khác với điều đó, tôi chỉ làm điều đó bởi vì tôi không thể xử lý các phép tính phân tích và cố gắng mô phỏng theo cách của tôi ra khỏi nó?

c) Tôi cũng sẽ sử dụng nó nếu các phép tính "thường" được thực hiện bằng cách sử dụng một số phép tính gần đúng bởi vì điều này có lẽ sẽ cho tôi độ chính xác cao hơn ...?

Đối với tôi, lợi ích của bootstrap (không theo tỷ lệ) dường như nằm ở chỗ tôi không cần phải đảm nhận bất kỳ phân phối nào. Đối với bootstrap tham số mà lợi thế không còn nữa - hoặc có những thứ tôi đã bỏ lỡ và bootstrap tham số cung cấp lợi ích cho những thứ được đề cập ở trên?

— BootstrapBill
nguồn

Về cơ bản là chính xác - bạn đang giao dịch lỗi phân tích cho lỗi monte carlo. Bootstrap tham số cũng là một mẫu sau gần đúng.

— xác suất

bạn có nghĩa là mẫu sau gần đúng như trong bayesian? tôi vẫn không hoàn toàn nhận được kết nối giữa bootstrapping và ước tính khả năng tối đa. Nhưng đó là một câu chuyện khác nhau. Cảm ơn về câu trả lời của bạn!

— BootstrapBill

Đúng. Bạn đúng rồi. Nhưng bootstrap tham số bảo vệ kết quả tốt hơn khi các giả định giữ. Nghĩ theo cách này:

Chúng tôi có một mẫu ngẫu nhiên từ một phân phối . Chúng tôi ước tính một tham số quan tâm là một hàm của . Ước tính này là một biến ngẫu nhiên, vì vậy nó có một phân phối chúng ta gọi là . Phân phối này được xác định đầy đủ bởi và có nghĩa là $X_1, \ldots, X_n$ $F$ $\theta$ $\hat{\theta} = h (X_1, \ldots, X_n)$ $G$ $h$ $F$ $G=G(h,F)$ . Khi làm bất kỳ loại bootstrap (tham số, phi tham số, tái lấy mẫu) những gì chúng tôi đang làm là để ước tính với để có được một ước tính của , . Từ chúng tôi ước tính các thuộc tính của . Có gì thay đổi loại differents fom của bootstrap là cách chúng ta có được . $F$ $\hat{F}$ $G$ $\hat G = G(h,\hat{F})$ $\hat G$ $\hat \theta$ $\hat{F}$

Nếu bạn có thể phân tích tính toán bạn nên đi cho nó, nhưng nhìn chung, nó là một điều khá khó khăn để làm. Sự kỳ diệu của bootstrap là chúng ta có thể tạo ra mẫu với phân phối . Để làm điều này, chúng ta tạo ra ngẫu nhiên các mẫu với phân phối và tính toán $\hat{G} = G(h,\hat{F})$ $\hat G$ $X^b_1, \ldots, X^b_n$ $\hat F$ Mà sẽ làm theo các phân phối. $\hat {\theta}^b = h(X^b_1, \ldots, X^b_n)$ $\hat G$

Một khi bạn nghĩ về nó theo cách này, những lợi thế của bootstrap tham số là rõ ràng. sẽ là một xấp xỉ tốt hơn , sau đó sẽ được gần gũi hơn với và cuối cùng là ước tính của 's thuộc tính sẽ tốt hơn. $\hat{F}$ $F$ $\hat{G}$ $G$ $\hat{\theta}$

— Manuel
nguồn

Vì vậy, nếu chúng ta đặt nó theo mức độ hội tụ bậc cao hơn, chúng ta sẽ thấy rằng mặc dù bootstrap tham số và không tham số có cùng thứ tự hội tụ (tôi nghĩ rằng những gì được viết trong thống kê tiệm cận van der vaarts), tham số vẫn tốt hơn. Nhưng chỉ xét về một số yếu tố?

— BootstrapBill