Hai phương pháp kiểm tra ý nghĩa bootstrap


10

Sử dụng bootstrap tôi tính toán giá trị p của các bài kiểm tra quan trọng bằng hai phương pháp:

  1. lấy mẫu lại theo giả thuyết khống và tính kết quả ít nhất là cực đoan như kết quả đến từ dữ liệu gốc
  2. lấy mẫu lại theo giả thuyết thay thế và tính kết quả ít nhất là cách xa kết quả ban đầu là giá trị tương ứng với giả thuyết khống

Tôi tin rằng cách tiếp cận thứ 1 là hoàn toàn chính xác vì nó tuân theo định nghĩa của giá trị ap. Tôi không chắc chắn về lần thứ hai, nhưng nó thường cho kết quả rất giống nhau và nhắc nhở tôi về bài kiểm tra Wald.

Tôi có đúng không Cả hai phương pháp đều đúng? Chúng giống hệt nhau (đối với các mẫu lớn)?


Ví dụ cho hai phương pháp (chỉnh sửa sau câu hỏi của DWin và câu trả lời của Erik):
Ví dụ 1. Hãy xây dựng một thử nghiệm bootstrap tương tự như hai thử nghiệm T mẫu. Phương pháp 1 sẽ lấy mẫu lại từ một mẫu (thu được bằng cách gộp hai mẫu gốc). Phương pháp 2 sẽ lấy mẫu lại từ cả hai mẫu một cách độc lập.

Ví dụ 2. Chúng ta hãy xây dựng một bài kiểm tra bootstrap về mối tương quan giữa x₁ rọ xₐ và y₁ đào yₐ. Phương pháp 1 sẽ giả sử không có mối tương quan và mẫu lại cho phép các cặp (xₑ, yₔ) trong đó e ≠. Phương pháp 2 sẽ biên dịch một mẫu bootstrap của các cặp (x, y) ban đầu.

Ví dụ 3. Hãy xây dựng một bài kiểm tra bootstrap để kiểm tra xem một đồng tiền có công bằng không. Phương pháp 1 sẽ tạo các mẫu ngẫu nhiên cài đặt Pr (head) = Pr (tail) =. Phương pháp 2 sẽ lấy mẫu lại các giá trị đầu / đuôi thử nghiệm và so sánh tỷ lệ với.


"Giả thuyết thay thế" nào? Trong danh pháp nghề cá truyền thống, sẽ không chỉ có một lựa chọn thay thế mà là một gia đình thay thế vô hạn. Và làm thế nào để bạn "lấy mẫu theo một giả thuyết" cho vấn đề đó? Lấy mẫu được thực hiện trên dữ liệu. giả thuyết là về một tham số.
DWin

@DWin: Cảm ơn, xin vui lòng xem ví dụ của tôi được thêm vào câu hỏi của tôi.
thắng cuộc

Câu trả lời:


7

Cách tiếp cận đầu tiên là cổ điển và đáng tin cậy nhưng không phải lúc nào cũng có thể được sử dụng. Để có được các mẫu bootstrap giả định giả thuyết null, bạn phải sẵn sàng chấp nhận phân phối lý thuyết để giữ ( đây là tùy chọn đầu tiên của bạn ) hoặc giả sử rằng thống kê quan tâm của bạn có hình dạng phân phối giống nhau khi chuyển sang giả thuyết null ( tùy chọn thứ hai của bạn ). Ví dụ, theo giả định thông thường, phân phối t có hình dạng tương tự khi được chuyển sang một giá trị trung bình khác. Tuy nhiên, khi thay đổi tần số null 0,5 của phân phối nhị thức thành 0,025 cũng sẽ thay đổi hình dạng.

Theo kinh nghiệm của tôi, nếu không, trong trường hợp bạn sẵn sàng đưa ra những giả định này, bạn cũng thường có những lựa chọn khác. Trong ví dụ của bạn 1) trong đó bạn dường như cho rằng cả hai mẫu có thể đến từ cùng một quần thể cơ sở, theo tôi, xét nghiệm hoán vị sẽ tốt hơn.

α(1-α)

Đây là một phương pháp rất linh hoạt và áp dụng cho nhiều bài kiểm tra. Tuy nhiên, điều rất quan trọng là xây dựng các khoảng tin cậy bootstrap tốt và không chỉ đơn giản là sử dụng phương pháp xấp xỉ Wald hoặc phương pháp phân vị. Một số thông tin có ở đây: Khoảng tin cậy dựa trên Bootstrap


1
Câu trả lời tốt đẹp. Vậy lựa chọn thứ hai đòi hỏi sự đối xứng quá phải không? Giả sử giá trị trung bình của khoảng tin cậy của bạn lớn hơn 0 và bạn đang xem H không phải là 0. Sau đó, nhìn vào 0 trong khoảng tin cậy của bạn khác với việc xem giá trị trung bình của giả định H không ( đây là hai hướng khác nhau, nếu bạn cho rằng bạn đang dịch chuyển khoảng tin cậy).
michal

@erik vừa bắt đầu một tiền thưởng cho một câu hỏi tương tự - về cơ bản là một phiên bản dài của nhận xét trên - khi nào có thể sử dụng tùy chọn 2 và trong điều kiện nào? stats.stackexchange.com/questions/175659/ Mạnh
Xavier Bourret Sicotte
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.