Tại sao dữ liệu nên được lấy lại theo giả thuyết null trong thử nghiệm giả thuyết bootstrap?


11

Ứng dụng đơn giản của phương pháp bootstrap để thử nghiệm giả thuyết là để ước lượng khoảng tin cậy của bài kiểm tra thống kê θ bằng cách liên tục tính toán nó trên các mẫu bootstrapped (Hãy thống kê θ lấy mẫu từ bootstrap được gọi ^ θ * ). Chúng tôi từ chối H 0 nếu tham số giả thuyết q 0 (mà thường bằng 0) dối trá bên ngoài của khoảng tin cậy của ^ θ * .θ^θ^θ^H0θ0θ^

Tôi đã đọc, rằng phương pháp này thiếu một số sức mạnh. Trong bài báo của trường P. và Wilson SR "Hai Hướng dẫn Bootstrap Kiểm định giả thuyết" (1992) nó được viết như phương châm đầu tiên, người ta nên Resample , không phải là ^ θ * - θ 0 . Và đây là phần tôi không hiểu.θ^θ^θ^θ0

Mà không phải là biện pháp chỉ thiên vị của ước lượng ^ θ * ? Đối với ước lượng không thiên vị các khoảng tin cậy của biểu thức này nên luôn luôn nhỏ hơn ^ θ * - θ 0 , nhưng tôi không thấy, những gì nó đã làm với thử nghiệm cho θ = θ 0 ? Không có nơi nào tôi có thể thấy chúng tôi đưa thông tin về θ 0 .θ^θ^θ^θ^θ0θ^=θ0θ0


Đối với những người bạn, những người không có quyền truy cập vào bài viết này, đây là một trích dẫn của đoạn có liên quan ngay sau luận án:

Để đánh giá cao lý do tại sao điều này lại quan trọng, hãy quan sát rằng thử nghiệm sẽ liên quan đến việc từ chối nếu trong | Θ - θ 0 | Nó quá lớn." Nếu θ 0 là một chặng đường dài từ giá trị thực của θ (nghĩa là, nếu H 0 là tổng sai số) thì chênh lệch | Θ - θ 0 | sẽ không bao giờ trông quá lớn so với phân phối bootstrap không định lượng của | Θ - θ 0 | . Một so sánh có ý nghĩa hơn với việc phân phốiH0|θ^θ0|θ0θH0|θ^θ0||θ^θ0|. Trong thực tế, nếu giá trị thực sự củaθ θ 1 sau đó sức mạnh của sự gia tăng kiểm tra bootstrap tới 1 như | θ 1 - θ 0 | tăng, kiểm tra được cung cấp dựa trên việc lấy mẫu lại | ^ Θ * - θ | , Nhưng sức mạnh hoặc giảm ở hầu hết các mức ý nghĩa (như | q 1 - θ 0 | tăng) nếu thử nghiệm dựa trên resampling | θ -|θ^θ^|θθ1|θ1θ0||θ^θ^||θ1θ0||θ^θ0|

Câu trả lời:


7

Đây là nguyên tắc tương tự bootstrap. Các (không rõ) cơ bản đúng phân phối được sản xuất một mẫu trong tầm tay x 1 , ... , x n với lũy F n , do đó sản xuất số liệu thống kê θ = T ( F n ) đối với một số chức năng T ( ) . Ý tưởng của bạn bằng cách sử dụng bootstrap là để lập báo cáo về sự phân bố lấy mẫu dựa trên một bản phân phối nổi tiếng ~ FFx1,,xnFnθ^=T(Fn)T()F~, Nơi bạn cố gắng sử dụng một giao thức lấy mẫu giống hệt nhau (mà chính xác là có thể chỉ cho dữ liệu iid; dữ liệu phụ thuộc luôn dẫn đến những hạn chế trong cách chính xác người ta có thể mô phỏng lại quá trình lấy mẫu), và áp dụng các chức năng tương tự . Tôi đã chứng minh nó trong một bài viết khác với (những gì tôi nghĩ là) một sơ đồ gọn gàng. Vì vậy, tương tự bootstrap của (lấy mẫu + có hệ thống) độ lệch θ - θ 0 , số lượng quan tâm trung tâm của bạn, là độ lệch của bootstrap lặp θ * so với những gì được biết đến là đúng đối với sự phân bố ~ F , việc lấy mẫu quy trình bạn áp dụng, và chức năngT()θ^θ0θ^F~ , tức là đo lại xu hướng trung tâm là T ( ~ F ) . Nếu bạn sử dụng bootstrap phi tham tiêu chuẩn với thay thế từ các dữ liệu ban đầu, bạn ~ F = F n , vì vậy biện pháp của bạn trong những xu hướng trung tâm phải là T ( F n ) q dựa trên dữ liệu gốc.T()T(F~)F~=FnT(Fn)θ^

Bên cạnh việc dịch thuật, có những vấn đề tinh vi hơn đang diễn ra với các bài kiểm tra bootstrap đôi khi rất khó khắc phục. Phân phối thống kê kiểm tra theo null có thể khác biệt lớn so với phân phối thống kê kiểm tra theo phương án thay thế (ví dụ: trong các thử nghiệm trên ranh giới của không gian tham số thất bại với bootstrap ). Các bài kiểm tra đơn giản mà bạn học trong các lớp đại học như -test là bất biến theo ca, nhưng suy nghĩ, "Heck, tôi chỉ thay đổi mọi thứ" thất bại một khi bạn phải chuyển sang cấp độ phức tạp về khái niệm tiếp theo, các bài kiểm tra tiệm cận χ 2 . Hãy nghĩ về điều này: bạn đang thử nghiệm mà μ = 0 , và bạn quan sát ˉ x =tχ2μ=0 . Sau đó, khi bạn xây dựng mộtthử nghiệm χ 2 ( ˉ x - μ ) 2 / ( s 2 / n ) ˉ x 2 / ( s 2 / n ) với tương tự bootstrap ˉ x 2 / ( s 2 / n ) , sau đó thử nghiệm này có tích hợp không tính trung tâm của n ˉ x 2 / s 2x¯=0.78χ2(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2ngay từ đầu, thay vì là một bài kiểm tra trung tâm như chúng ta mong đợi. Để làm trung tâm kiểm tra bootstrap, bạn thực sự phải trừ ước tính ban đầu.

Các thử nghiệm là không thể tránh khỏi trong các bối cảnh đa biến, từ Pearson χ 2 cho các bảng dự phòng cho đến bootstrap của Bollen-Stine của thống kê kiểm tra trong các mô hình phương trình cấu trúc. Khái niệm dịch chuyển phân phối là cực kỳ khó xác định tốt trong các tình huống này ... mặc dù trong trường hợp các phép thử trên ma trận hiệp phương sai đa biến, điều này có thể thực hiện được bằng một phép quay thích hợp .χ2χ2


Cảm ơn bạn. Có một suy nghĩ tôi vẫn không hiểu: chúng ta sẽ đưa thông tin về vào đâu trong bootstrap? Trong đó H 0 là sai, θ 0 có thể bị giảm đáng kể so với phân phối thực. θ0H0θ0
Adam Ryczkowski

Bạn tính giá trị p dưới null, vì vậy bạn nên được xem xét trường hợp khi phù hợp với những null. Xem xét sự thay thế tất nhiên là đáng làm theo phương án thay thế, nhưng đó là ... wow ... đó sẽ là một cách sử dụng nâng cao của phương pháp thử nghiệm bootstrap. θ0
StasK

3

OK, tôi đã hiểu rồi. Cảm ơn bạn, StasK, vì một câu trả lời tốt. Tôi sẽ giữ nó chấp nhận cho người khác học, nhưng trong trường hợp cụ thể của tôi, tôi đã bỏ lỡ một thực tế rất đơn giản:

Quy trình bootstrap theo hướng dẫn của Hall & Wilson cho thử nghiệm trung bình một mẫu đơn giản là thế này (trong mã giả lấy cảm hứng từ R):

1function(dataθ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

θ02θ^

26p.valuestatistic7


θ^θθ0(θ^θ^)(θ^θ0)

1
Có lẽ hữu ích: Michael Chernick cung cấp một trực giác cô đọng để trả lời cho câu hỏi liên quan của tôi ở đây. stats.stackexchange.com/questions/289236/ Google )
một nửa vượt qua
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.