Hãy xem xét một thí nghiệm với nhiều người tham gia, mỗi người được đo nhiều lần trong hai điều kiện. Một mô hình hiệu ứng hỗn hợp có thể được xây dựng (sử dụng cú pháp lme4 ) như:
fit = lmer(
formula = measure ~ (1|participant) + condition
)
Bây giờ, giả sử tôi muốn tạo khoảng tin cậy khởi động cho các dự đoán của mô hình này. Tôi nghĩ rằng tôi đã đưa ra một phương pháp đơn giản và hiệu quả về mặt tính toán và tôi chắc chắn tôi không phải là người đầu tiên nghĩ về nó, nhưng tôi gặp khó khăn khi tìm bất kỳ ấn phẩm nào trước đây mô tả phương pháp này. Đây là:
- Lắp mô hình (như trên), gọi đây là "mô hình gốc"
- Lấy dự đoán từ mô hình ban đầu, gọi đây là "dự đoán ban đầu"
- Có được phần dư từ mô hình ban đầu được liên kết với từng phản hồi từ mỗi người tham gia
- Lấy mẫu lại phần dư, lấy mẫu người tham gia thay thế
- Điều chỉnh mô hình hiệu ứng hỗn hợp tuyến tính với lỗi gaussian cho phần dư , gọi đây là "mô hình tạm thời"
- Tính toán dự đoán từ mô hình tạm thời cho từng điều kiện (những dự đoán này sẽ rất gần với 0), hãy gọi đây là "dự đoán tạm thời"
- Thêm dự đoán tạm thời vào dự đoán ban đầu, gọi kết quả là "dự đoán mẫu"
- Lặp lại các bước từ 4 đến 7 nhiều lần, tạo ra phân phối dự đoán mẫu lại cho từng điều kiện mà từ đó một lần có thể tính toán các TCTD.
Tôi đã thấy các quy trình "bootstrapping dư" trong bối cảnh hồi quy đơn giản (không phải là mô hình hỗn hợp) trong đó phần dư được lấy mẫu là đơn vị lấy mẫu lại và sau đó thêm vào các dự đoán của mô hình ban đầu trước khi khớp một mô hình mới trên mỗi lần lặp của bootstrap, nhưng điều này có vẻ khá khác so với cách tiếp cận mà tôi mô tả nơi phần dư không bao giờ được lấy lại, mọi người và chỉ saumô hình tạm thời thu được làm cho các dự đoán mô hình ban đầu đi vào hoạt động. Tính năng cuối cùng này có một lợi ích phụ rất tốt ở chỗ, bất kể độ phức tạp của mô hình ban đầu, mô hình tạm thời luôn có thể phù hợp như một mô hình hỗn hợp tuyến tính gaussian, có thể nhanh hơn đáng kể trong một số trường hợp. Ví dụ, gần đây tôi có dữ liệu nhị thức và 3 biến dự đoán, một trong số đó tôi nghi ngờ sẽ gây ra hiệu ứng phi tuyến tính mạnh, vì vậy tôi phải sử dụng Mô hình hỗn hợp phụ gia tổng quát bằng cách sử dụng hàm liên kết nhị thức. Việc lắp mô hình ban đầu trong trường hợp này mất hơn một giờ, trong khi việc lắp LMM gaussian trên mỗi lần lặp chỉ mất vài giây.
Tôi thực sự không muốn yêu cầu ưu tiên về vấn đề này nếu nó đã là một thủ tục đã biết, vì vậy tôi rất biết ơn nếu có ai có thể cung cấp thông tin về nơi mà điều này có thể được mô tả trước đây. (Ngoài ra, nếu có bất kỳ vấn đề rõ ràng nào với phương pháp này, hãy cho tôi biết!)