Bootstrap: ước tính nằm ngoài khoảng tin cậy


10

Tôi đã thực hiện bootstrapping với một mô hình hỗn hợp (một số biến có tương tác và một biến ngẫu nhiên). Tôi đã nhận được kết quả này (chỉ một phần):

> boot_out

ORDINARY NONPARAMETRIC BOOTSTRAP

Call:
boot(data = a001a1, statistic = bootReg, R = 1000)

Bootstrap Statistics :
          original        bias     std. error
t1*   4.887383e+01 -1.677061e+00 4.362948e-01
t2*   3.066825e+01  1.264024e+00 5.328387e-01
t3*   8.105422e+01  2.368599e+00 6.789091e-01
t4*   1.620562e+02  4.908711e+00 1.779522e+00
......

Bây giờ, tôi muốn có được khoảng tin cậy cho việc đánh chặn:

> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates

CALL : 
boot.ci(boot.out = boot_out, type = c("norm", "basic", 
"perc"), index = 1)

Intervals : 
Level      Normal              Basic              Percentile     
95%   (49.70, 51.41 )   (49.70, 51.41 )   (46.34, 48.05 )  
Calculations and Intervals on Original Scale

Sai lệch đã được hiệu chỉnh ước tính là:

48.873 -1.677
1 47.196

Vấn đề tôi có là CI bình thường và cơ bản nằm ngoài dự toán (bản gốc và đã được sửa). Tôi chỉ tự hỏi làm thế nào để đối phó với điều đó.

Cập nhật 1:
Đây là một câu hỏi tương tự với rất nhiều câu trả lời.


2
Chỉ cần một nhận xét: Efron & Tibshirani (1993) trong cuốn sách kinh điển đã lập luận thay vì chống lại sự điều chỉnh thiên vị nói rằng đó là một thực hành "nguy hiểm" và "có vấn đề" có thể dẫn đến lỗi tiêu chuẩn tăng lên.
Tim

@Tim Cảm ơn bình luận của bạn. Tôi sẽ có một cái nhìn vào cuốn sách. Có lẽ, một giải pháp là sử dụng các ước tính và bootstrap se * để tính các khoảng tin cậy. Trong trường hợp của tôi, sự thiên vị chỉ ảnh hưởng đến các ước tính.
giordano

Câu trả lời:


1

Khó khăn bạn đang gặp phải là từ toán học ngụ ý. Một trung tâm của công cụ ước tính vị trí, hoặc một công cụ ước tính khoảng, có thể được coi là tối thiểu hóa hàm chi phí trên một phân phối. Giá trị trung bình mẫu trên Gaussian giảm thiểu tổn thất bậc hai, trong khi trung vị giảm thiểu hàm mất tuyến tính tuyệt đối so với Gaussian. Mặc dù trong dân số chúng được đặt tại cùng một điểm, chúng được phát hiện bằng các hàm chi phí khác nhau.

Chúng tôi cung cấp cho bạn một thuật toán và nói "làm điều này", nhưng trước khi thuật toán được phát triển, ai đó đã giải quyết vấn đề tối ưu hóa.

Bạn đã áp dụng bốn hàm chi phí khác nhau cho bạn ba khoảng và một công cụ ước tính điểm. Vì các hàm chi phí là khác nhau, chúng cung cấp cho bạn các điểm và khoảng khác nhau. Không có gì để làm về nó ngoại trừ việc thống nhất phương pháp thủ công.

Bạn cần tìm các giấy tờ cơ bản và xem mã bên dưới để hiểu những cái nào ánh xạ tới loại vấn đề nào.

Xin lỗi để nói điều này, nhưng bạn đã bị phần mềm phản bội. Nó đã làm công việc của nó và trung bình công việc này rất tốt, nhưng bạn đã lấy được mẫu mà phần mềm sẽ không hoạt động. Hoặc, đúng hơn, nó đang hoạt động hoàn hảo và bạn cần thực sự làm việc theo cách lạc hậu thông qua các tài liệu để xác định những gì nó đang thực sự làm.


Cảm ơn vì nó đã làm công việc của mình và trung bình công việc này rất tốt, nhưng bạn đã có được mẫu mà phần mềm sẽ không hoạt động và những hiểu biết khác. Thật vậy, mẫu này kỳ lạ là lý do tại sao tôi muốn sử dụng Bootsstrap để tính CI. Rõ ràng, phương pháp này dường như không đơn giản như nó xuất hiện.
giordano
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.