Câu hỏi này đã được kích hoạt bởi một cái gì đó tôi đọc trong sách giáo khoa thống kê cấp độ sau đại học và cũng (độc lập) nghe trong bài trình bày này tại một hội thảo thống kê. Trong cả hai trường hợp, câu lệnh đều nằm dọc theo dòng "vì kích thước mẫu khá nhỏ, chúng tôi quyết định thực hiện ước tính thông qua bootstrap thay vì (hoặc cùng với) phương thức tham số ".
Họ không đi vào chi tiết, nhưng có lẽ lý do là như sau: Phương pháp giả định các dữ liệu theo một số tham số phân phối D . Trong thực tế, phân phối không chính xác là D , nhưng nó vẫn ổn miễn là cỡ mẫu đủ lớn. Vì trong trường hợp này, cỡ mẫu quá nhỏ, hãy chuyển sang bootstrap (không tham số) mà không đưa ra bất kỳ giả định phân phối nào. Vấn đề được giải quyết!
Theo tôi, đó không phải là những gì bootstrap dành cho. Đây là cách tôi nhìn thấy: bootstrap có thể mang lại lợi thế khi ít nhiều rõ ràng rằng có đủ dữ liệu, nhưng không có giải pháp dạng đóng để nhận lỗi tiêu chuẩn, giá trị p và thống kê tương tự. Một ví dụ kinh điển là lấy CI cho hệ số tương quan được lấy một mẫu từ phân phối chuẩn bivariate: giải pháp dạng đóng tồn tại, nhưng nó rất phức tạp khi bootstrapping đơn giản hơn. Tuy nhiên, không có gì ngụ ý rằng bootstrap bằng cách nào đó có thể giúp một người thoát khỏi với một cỡ mẫu nhỏ.
Nhận thức của tôi có đúng không?
Nếu bạn thấy câu hỏi này thú vị, có một câu hỏi bootstrap cụ thể hơn, cụ thể hơn từ tôi:
Tái bút: Tôi không thể giúp chia sẻ một ví dụ điển hình về cách tiếp cận bootstrap của LỚN. Tôi không tiết lộ tên của tác giả, nhưng anh ta là một trong những thế hệ cũ Quants phạm, người đã viết một cuốn sách về Tài chính định lượng năm 2004. Ví dụ được lấy từ đó.
Hãy xem xét vấn đề sau: giả sử bạn có 4 tài sản và 120 quan sát lợi nhuận hàng tháng cho mỗi tài sản. Mục tiêu là để xây dựng cdf 4 chiều chung của lợi nhuận hàng năm. Ngay cả đối với một tài sản duy nhất, nhiệm vụ dường như khó đạt được chỉ với 10 lần quan sát hàng năm, chứ chưa nói đến việc ước tính cdf 4 chiều. Nhưng đừng lo lắng, bộ khởi động trên máy tính xách tay sẽ giúp bạn giải quyết: lấy tất cả các quan sát 4 chiều có sẵn, lấy mẫu lại 12 với thay thế và kết hợp chúng để tạo ra một vectơ 4 chiều của Boot bootstraged một lần. Lặp lại 1000 lần đó và, lo và kìa, bạn đã có cho mình một mẫu bootstrap của Google với 1000 lợi nhuận hàng năm. Sử dụng mẫu này làm mẫu iid có kích thước 1000 cho mục đích ước tính cdf hoặc bất kỳ suy luận nào khác có thể được rút ra từ một lịch sử hàng nghìn.