Sử dụng bootstrap tôi tính toán giá trị p của các bài kiểm tra quan trọng bằng hai phương pháp:
- lấy mẫu lại theo giả thuyết khống và tính kết quả ít nhất là cực đoan như kết quả đến từ dữ liệu gốc
- lấy mẫu lại theo giả thuyết thay thế và tính kết quả ít nhất là cách xa kết quả ban đầu là giá trị tương ứng với giả thuyết khống
Tôi tin rằng cách tiếp cận thứ 1 là hoàn toàn chính xác vì nó tuân theo định nghĩa của giá trị ap. Tôi không chắc chắn về lần thứ hai, nhưng nó thường cho kết quả rất giống nhau và nhắc nhở tôi về bài kiểm tra Wald.
Tôi có đúng không Cả hai phương pháp đều đúng? Chúng giống hệt nhau (đối với các mẫu lớn)?
Ví dụ cho hai phương pháp (chỉnh sửa sau câu hỏi của DWin và câu trả lời của Erik):
Ví dụ 1. Hãy xây dựng một thử nghiệm bootstrap tương tự như hai thử nghiệm T mẫu. Phương pháp 1 sẽ lấy mẫu lại từ một mẫu (thu được bằng cách gộp hai mẫu gốc). Phương pháp 2 sẽ lấy mẫu lại từ cả hai mẫu một cách độc lập.Ví dụ 2. Chúng ta hãy xây dựng một bài kiểm tra bootstrap về mối tương quan giữa x₁ rọ xₐ và y₁ đào yₐ. Phương pháp 1 sẽ giả sử không có mối tương quan và mẫu lại cho phép các cặp (xₑ, yₔ) trong đó e ≠. Phương pháp 2 sẽ biên dịch một mẫu bootstrap của các cặp (x, y) ban đầu.
Ví dụ 3. Hãy xây dựng một bài kiểm tra bootstrap để kiểm tra xem một đồng tiền có công bằng không. Phương pháp 1 sẽ tạo các mẫu ngẫu nhiên cài đặt Pr (head) = Pr (tail) =. Phương pháp 2 sẽ lấy mẫu lại các giá trị đầu / đuôi thử nghiệm và so sánh tỷ lệ với.