Điều gì dễ giải thích, mức độ phù hợp của các biện pháp phù hợp cho các mô hình hiệu ứng hỗn hợp tuyến tính?


37

Tôi hiện đang sử dụng gói R lme4 .

Tôi đang sử dụng một mô hình hiệu ứng hỗn hợp tuyến tính với các hiệu ứng ngẫu nhiên:

library(lme4)
mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects
mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + 
            # random effects
mod3 <- lmer(r1 ~ p1 + p2 + (1 | site), data = sample_set) #Two fixed effects + 
            # random effects

Để so sánh các mô hình, tôi đang sử dụng anovahàm và xem xét sự khác biệt trong AIC so với mô hình AIC thấp nhất:

anova(mod1, mod2, mod3)

Trên đây là tốt để so sánh các mô hình.

Tuy nhiên, tôi cũng cần một số cách đơn giản để diễn giải mức độ tốt của các biện pháp phù hợp cho từng mô hình. Có ai có kinh nghiệm với các biện pháp như vậy? Tôi đã thực hiện một số nghiên cứu và có các bài báo trên R bình phương cho các hiệu ứng cố định của các mô hình hiệu ứng hỗn hợp:

  • Cheng, J., Edwards, LJ, Maldonado-Molina, MM, Komro, KA, & Muller, KE (2010). Phân tích dữ liệu theo chiều dọc thực cho người thực: Xây dựng mô hình hỗn hợp đủ tốt. Thống kê trong Y học, 29 (4), 504-520. doi: 10.1002 / sim.3775
  • Edwards, LJ, Muller, KE, Wolfinger, RD, Qaqish, BF, & Schabenberger, O. (2008). Một thống kê R2 cho các hiệu ứng cố định trong mô hình hỗn hợp tuyến tính. Thống kê trong Y học, 27 (29), 6137-6157. doi: 10.1002 / sim.3429

Tuy nhiên, dường như có một số lời chỉ trích xung quanh việc sử dụng các biện pháp như những biện pháp được đề xuất trong các bài viết trên.

Ai đó có thể xin vui lòng đề xuất một vài cách dễ dàng để giải thích, sự tốt đẹp của các biện pháp phù hợp có thể áp dụng cho các mô hình của tôi?


2
Tôi thực sự thích những câu hỏi, nhưng sử dụng các bài kiểm tra tỷ lệ khả năng để xác định có hay không ảnh hưởng bất biến là cần thiết là không chiến lược khuyến cáo, xem faq . Vì vậy, ở trên là không tốt để so sánh các mô hình.
Henrik

Cảm ơn Henrik. Câu hỏi thường gặp bạn liệt kê là rất hữu ích. Có vẻ như việc lấy mẫu Monte Carlo chuỗi Markov có thể là một chiến lược tốt để so sánh các mô hình của tôi.
mjburns

1
Vấn đề với MCMC là bạn chỉ có thể có các hiệu ứng ngẫu nhiên đơn giản (như trong ví dụ của bạn). Tôi sẽ đi với xấp xỉ kenward-rogers với mức độ tự do vì nó cũng áp dụng cho các mô hình phức tạp hơn. Hãy xem chức năng mixed()trong gói afex của tôi ( phiên bản phát triển cũng có bootstrap tham số ). Xem ở đây để tham khảo một số .
Henrik

Được rồi Henrik. Tôi quản lý để có được hàm hỗn hợp () của bạn làm việc từ gói afex. Bạn có thể vui lòng tư vấn về cách tôi có thể sử dụng afex để so sánh các mô hình? Tôi có thể sử dụng biện pháp nào để quyết định xem một mô hình có hợp lý hơn mô hình khác không? Cảm ơn.
mjburns

Điều này không dễ trả lời, có lẽ bạn hỏi một câu hỏi riêng để biết thêm chi tiết. Nhưng chỉ một thời gian ngắn, afex cố gắng giúp bạn đánh giá xem một số hiệu ứng nhất định (hoặc các mô hình tốt hơn bao gồm hiệu ứng này) có đáng kể hay không. Để kết thúc này, nó sử dụng KRmodcomptừ gói pbkrtest. Bạn cũng có thể sử dụng KRmodcomptrực tiếp để so sánh các mô hình.
Henrik

Câu trả lời:


3

Không có gì dễ hiểu như mức độ dễ hiểu của thước đo phù hợp cho các mô hình hỗn hợp tuyến tính :)

Mức độ phù hợp của hiệu ứng ngẫu nhiên (mod1) có thể được đo bằng ICCICC2(tỷ lệ giữa phương sai được tính bằng hiệu ứng ngẫu nhiên và phương sai còn lại). gói tâm lý R bao gồm một hàm để trích xuất chúng tạo thành một đối tượng lme.

Có thể sử dụng R2để đánh giá hiệu ứng cố định (mod2, mod3), nhưng điều này có thể khó khăn: Khi hai mô hình hiển thị R2 tương tự, đó có thể là trường hợp một "chính xác" hơn, nhưng bị che bởi yếu tố cố định của nó " trừ "một thành phần phương sai lớn hơn cho hiệu ứng ngẫu nhiên. Mặt khác, thật dễ dàng để giải thích một R2 lớn hơn của mô hình bậc cao nhất (ví dụ mod3). Trong chương của Baayen về các mô hình hỗn hợp, có một cuộc thảo luận thú vị về điều này. Ngoài ra, hướng dẫn của nó rất rõ ràng.

Một giải pháp khả thi là xem xét từng cái một variance componentcách độc lập, và sau đó sử dụng chúng để so sánh các mô hình.


1
Bạn có thể cho chúng tôi biết những gì bạn đang đề cập đến khi bạn nói chương của Baayen không?
KH Kim

yeah, tài liệu tham khảo bị hỏng!
Tò mò

Tôi đã tìm thấy trích dẫn này, không chắc là nó, nhưng không thể lấy PDF ở bất cứ đâu: BaayenR. H., Phân tích dữ liệu ngôn ngữ: Giới thiệu thực tế về thống kê sử dụng R. Cambridge: Nhà xuất bản Đại học Cambridge, 2008 Pp. 368. ISBN-13: 980-0-521-70918-7. - Khối lượng 37 Số 2 - Grzegorz Krajewski, Danielle Matthews
Tò mò

1
Cố lên các bạn. Google-foo của bạn ở đâu? Thực hiện tìm kiếm trên "baayenCUPstats.pdf: lần truy cập đầu tiên: sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf
DWin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.