Có một tên cho loại bootstrapping này?


9

Hãy xem xét một thí nghiệm với nhiều người tham gia, mỗi người được đo nhiều lần trong hai điều kiện. Một mô hình hiệu ứng hỗn hợp có thể được xây dựng (sử dụng cú pháp lme4 ) như:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

Bây giờ, giả sử tôi muốn tạo khoảng tin cậy khởi động cho các dự đoán của mô hình này. Tôi nghĩ rằng tôi đã đưa ra một phương pháp đơn giản và hiệu quả về mặt tính toán và tôi chắc chắn tôi không phải là người đầu tiên nghĩ về nó, nhưng tôi gặp khó khăn khi tìm bất kỳ ấn phẩm nào trước đây mô tả phương pháp này. Đây là:

  1. Lắp mô hình (như trên), gọi đây là "mô hình gốc"
  2. Lấy dự đoán từ mô hình ban đầu, gọi đây là "dự đoán ban đầu"
  3. Có được phần dư từ mô hình ban đầu được liên kết với từng phản hồi từ mỗi người tham gia
  4. Lấy mẫu lại phần dư, lấy mẫu người tham gia thay thế
  5. Điều chỉnh mô hình hiệu ứng hỗn hợp tuyến tính với lỗi gaussian cho phần , gọi đây là "mô hình tạm thời"
  6. Tính toán dự đoán từ mô hình tạm thời cho từng điều kiện (những dự đoán này sẽ rất gần với 0), hãy gọi đây là "dự đoán tạm thời"
  7. Thêm dự đoán tạm thời vào dự đoán ban đầu, gọi kết quả là "dự đoán mẫu"
  8. Lặp lại các bước từ 4 đến 7 nhiều lần, tạo ra phân phối dự đoán mẫu lại cho từng điều kiện mà từ đó một lần có thể tính toán các TCTD.

Tôi đã thấy các quy trình "bootstrapping dư" trong bối cảnh hồi quy đơn giản (không phải là mô hình hỗn hợp) trong đó phần dư được lấy mẫu là đơn vị lấy mẫu lại và sau đó thêm vào các dự đoán của mô hình ban đầu trước khi khớp một mô hình mới trên mỗi lần lặp của bootstrap, nhưng điều này có vẻ khá khác so với cách tiếp cận mà tôi mô tả nơi phần dư không bao giờ được lấy lại, mọi người và chỉ saumô hình tạm thời thu được làm cho các dự đoán mô hình ban đầu đi vào hoạt động. Tính năng cuối cùng này có một lợi ích phụ rất tốt ở chỗ, bất kể độ phức tạp của mô hình ban đầu, mô hình tạm thời luôn có thể phù hợp như một mô hình hỗn hợp tuyến tính gaussian, có thể nhanh hơn đáng kể trong một số trường hợp. Ví dụ, gần đây tôi có dữ liệu nhị thức và 3 biến dự đoán, một trong số đó tôi nghi ngờ sẽ gây ra hiệu ứng phi tuyến tính mạnh, vì vậy tôi phải sử dụng Mô hình hỗn hợp phụ gia tổng quát bằng cách sử dụng hàm liên kết nhị thức. Việc lắp mô hình ban đầu trong trường hợp này mất hơn một giờ, trong khi việc lắp LMM gaussian trên mỗi lần lặp chỉ mất vài giây.

Tôi thực sự không muốn yêu cầu ưu tiên về vấn đề này nếu nó đã là một thủ tục đã biết, vì vậy tôi rất biết ơn nếu có ai có thể cung cấp thông tin về nơi mà điều này có thể được mô tả trước đây. (Ngoài ra, nếu có bất kỳ vấn đề rõ ràng nào với phương pháp này, hãy cho tôi biết!)


1
Chỉ là một bình luận phụ, nhưng nó có thể có liên quan. Peter McCullagh có một bài báo ở Bernoulli , nơi ông cho thấy rằng không có bootstrap nào ước tính chính xác phương sai trong một mô hình hiệu ứng ngẫu nhiên.
hồng y

@Mike (+1) Đó là một câu hỏi được viết rất hay!
chl

1
Tại sao bạn không lấy mẫu lại những người tham gia thay thế và sau đó lấy mẫu lại dữ liệu của họ? Điều đó dường như được giữ vững hơn trong tinh thần của một mô hình đa cấp với một phân phối được lồng trong một phân phối khác. Một điểm khác là có một vấn đề tiềm ẩn với dữ liệu nhị thức vì các đầu cực của các mẫu sẽ ít có khả năng hội tụ.
John

@ John: Tôi thích lấy mẫu dư hơn vì (1) sẽ nhanh hơn khi mô hình ban đầu tốn nhiều công sức để ước tính và (2) nó mang lại các TCTD đã loại bỏ sự thay đổi do sự thay đổi giữa các phương tiện tham gia. # 2 có nghĩa là bạn không phải tạo nhiều ô khi bạn muốn hiển thị dữ liệu thô và hiệu ứng đo lặp lại; bạn chỉ có thể vẽ các TCTD bị loại bỏ giữa các phương sai này trên dữ liệu thô và chúng sẽ phù hợp để so sánh các điều kiện lặp lại trong các cá nhân. Cấp có thể có sự nhầm lẫn về ý nghĩa của các TCTD đó, nhưng đó là những gì chú thích con số dành cho.
Mike Lawrence

@ John: Bạn có thể giải thích về nỗi sợ hãi của bạn về khả năng áp dụng phương pháp này đối với dữ liệu nhị thức không?
Mike Lawrence

Câu trả lời:


-1

Cuốn sách của tôi Bootstrap Phương thức Phiên bản 2 có thư mục đồ sộ cho đến năm 2007. Vì vậy, ngay cả khi tôi không bao gồm chủ đề trong cuốn sách, tài liệu tham khảo có thể nằm trong thư mục. Tất nhiên một tìm kiếm Google với các từ khóa đúng có thể tốt hơn. Freedman, Peters và Navidi đã khởi động để dự đoán trong mô hình hồi quy tuyến tính và mô hình kinh tế lượng nhưng tôi không chắc những gì đã được thực hiện trên trường hợp mô hình hỗn hợp. Khoảng thời gian dự đoán Bootstrap trên giấy JASA 1985 của Stine cho hồi quy là điều bạn sẽ thấy rất thú vị nếu bạn chưa từng thấy nó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.