Bootstrapping với một số lượng nhỏ các quan sát


8

Giả sử tôi đã thu thập được một số lượng nhỏ (N) quan sát cho một giả thuyết mà tôi muốn kiểm tra. Tôi có thể sử dụng phương thức bootstrap để tạo phân phối mẫu cho kết quả trung bình của các quan sát N, nhưng tôi lo ngại rằng mô hình này có thể bị hỏng khi N rất nhỏ, tự đưa ra lỗi vào phân phối mẫu.

Vì vậy, câu hỏi của tôi là, làm thế nào tôi có thể xác định N tối thiểu là gì mà tôi cần cho kết quả hợp lý; hoặc định lượng hơn, N được liên kết với lỗi lấy mẫu như N-> 0 như thế nào?

Cập nhật: Tôi sắp hiểu rằng giá trị tối thiểu cho N sẽ thay đổi dựa trên bản chất của dữ liệu cơ bản. Vì vậy, trong trường hợp này tôi có thể thực hiện các quan sát meta nào để giúp tôi xác định điều này? Tôi không biết phân phối cơ bản thực sự, nếu không tôi sẽ không cần phải bootstrap.


1
Tôi đã thấy một nhận xét thú vị trong các bài giảng của giáo sư Wasserman tại stat.cmu.edu/~larry/=stat705/Lecture13.pdf . Ký hiệu bên cạnh phương trình (21) trên p. 6 gợi ý rằng lỗi bạn quan tâm với lỗi là 1 / sqrt (n). Thật không may, tôi không biết gì về hệ số không đổi.
tối đa

Câu trả lời:


7

Không có câu trả lời đơn giản cho vấn đề này, vì nó sẽ luôn phụ thuộc vào cả phân phối dữ liệu thực sự của bạn (hãy tưởng tượng trường hợp suy biến trong đó giá trị duy nhất được phép là 1: thì bootstrap từ mẫu có kích thước 1 sẽ tốt như mọi thứ !) và số liệu thống kê bạn sẽ tính toán: một số thống kê sẽ gặp khó khăn hơn trong việc phục hồi từ một cỡ mẫu nhỏ hơn các số liệu khác (hãy tưởng tượng một mô hình của một ngoại lệ cực đoan).

Vì vậy: bạn sẽ phải cụ thể hơn những gì bạn đã cho chúng tôi cho đến nay.


1
Người ta có thể suy luận về sự phân phối thực sự dựa trên các quan sát, có thể sử dụng phương sai của các quan sát? Trường hợp ngoại lệ cực kỳ khó khăn, nhưng nếu bạn đã nhìn thấy một trường hợp thì nó mang rất nhiều thông tin. Nếu chúng ta sửa lại câu hỏi để chỉ định N> 2, thì quan sát thứ hai sẽ cho chúng ta biết điều gì đó nếu N1 = N2 so với N1! = N2 (và sự khác biệt giữa chúng là gì).
G__

Bootstrapping của thái cực không làm việc, thời gian.
kjetil b halvorsen 16/2/18
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.