Tôi có một mô hình sống sót với các bệnh nhân được lồng trong các bệnh viện bao gồm hiệu ứng ngẫu nhiên cho các bệnh viện. Hiệu ứng ngẫu nhiên được phân phối bằng gamma và tôi đang cố gắng báo cáo "mức độ phù hợp" của thuật ngữ này theo thang điểm dễ hiểu.
Tôi đã tìm thấy các tài liệu tham khảo sau sử dụng Tỷ lệ rủi ro trung bình (hơi giống với tỷ lệ chênh lệch trung bình) và đã tính toán điều này.
Bengtsson T, Dribe M: Phương pháp lịch sử 43:15, 2010
Tuy nhiên, bây giờ tôi muốn báo cáo sự không chắc chắn liên quan đến ước tính này bằng cách sử dụng bootstrap. Dữ liệu là dữ liệu sinh tồn và do đó có nhiều quan sát cho mỗi bệnh nhân và nhiều bệnh nhân trên mỗi bệnh viện. Rõ ràng là tôi cần phải phân cụm các quan sát bệnh nhân khi lấy mẫu lại. Nhưng tôi không biết liệu tôi có nên phân cụm các bệnh viện không (ví dụ như lấy mẫu lại bệnh viện, thay vì bệnh nhân?
Tôi tự hỏi nếu câu trả lời phụ thuộc vào thông số quan tâm, và như vậy sẽ khác nếu mục tiêu là thứ gì đó có liên quan ở cấp độ bệnh nhân chứ không phải ở cấp độ bệnh viện?
Tôi đã liệt kê mã stata dưới đây trong trường hợp có ích.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr