Tính toán


13

Tôi đã đọc về cách tính giá trị trong các mô hình hỗn hợp và sau khi đọc Câu hỏi thường gặp về R-sig, các bài đăng khác trên diễn đàn này (tôi sẽ liên kết một vài nhưng tôi không có đủ danh tiếng) và một số tài liệu tham khảo khác tôi hiểu rằng sử dụng Giá trị trong bối cảnh các mô hình hỗn hợp là phức tạp.R 2R2R2

Tuy nhiên, gần đây tôi đã xem qua hai bài báo dưới đây. Mặc dù các phương pháp này có vẻ đầy triển vọng (với tôi) tôi không phải là một nhà thống kê, và vì vậy tôi tự hỏi liệu có ai khác có cái nhìn sâu sắc về các phương pháp mà họ đề xuất và cách họ so sánh với các phương pháp khác đã được đề xuất.

Nakagawa, Shinichi và Holger Schielzeth. "Một phương pháp chung và đơn giản để thu được R2 từ các mô hình hiệu ứng hỗn hợp tuyến tính tổng quát." Các phương pháp trong Sinh thái học và Tiến hóa 4.2 (2013): 133-142.

Johnson, Paul CD. "Mở rộng R2GLMM của Nakagawa & Schielzeth thành các mẫu dốc ngẫu nhiên." Các phương pháp trong Sinh thái học và Tiến hóa (2014).

Phương thức is cũng có thể được thực hiện bằng cách sử dụng hàm r.squaredGLMM trong gói MuMIn , đưa ra mô tả sau về phương thức.

Đối với các mô hình hiệu ứng hỗn hợp, có thể được phân loại thành hai loại. Marginal đại diện cho phương sai được giải thích bởi các yếu tố cố định và được định nghĩa là: có điều kiện được hiểu là phương sai được giải thích bởi cả hai yếu tố cố định và ngẫu nhiên (nghĩa là toàn bộ mô hình) và được tính theo phương trình: trong đó là phương sai của các thành phần hiệu ứng cố định và là tổng của tất cả các thành phần phương sai (nhóm, cá nhân, v.v.),R 2 R G L M M ( m ) 2 = σ 2 fR2R2 R2RGLMM(c)2=(σ 2 f +Σ(σ 2 l ))

RGLMM(m)2=σf2σf2+(σl2)+σe2+σd2
R2
RGLMM(c)2=(σf2+(σl2))(σf2+(σl2)+σe2+σd2
σf2(σl2)σl2là phương sai do phân tán phụ gia và là phương sai phân bố cụ thể. σd2

Trong phân tích của tôi, tôi đang xem xét dữ liệu theo chiều dọc và tôi chủ yếu quan tâm đến phương sai được giải thích bởi các hiệu ứng cố định trong mô hình

library(MuMIn) 
library(lme4)

fm1 <- lmer(zglobcog ~ age_c + gender_R2 + ibphdtdep + iyeareducc + apoegeno + age_c*apoegeno + (age_c | pathid), data = dat, REML = FALSE, control = lmerControl(optimizer = "Nelder_Mead"))

# Jarret Byrnes (correlation between the fitted and the observed values)
r2.corr.mer <- function(m) {
   lmfit <-  lm(model.response(model.frame(m)) ~ fitted(m))
   summary(lmfit)$r.squared
}

r2.corr.mer(fm1)
[1] 0.8857005

# Xu 2003
1-var(residuals(fm1))/(var(model.response(model.frame(fm1))))
[1] 0.8783479

# Nakagawa & Schielzeth's (2013)
r.squaredGLMM(fm1)
      R2m       R2c 
0.1778225 0.8099395 

Tôi đã chỉnh sửa bài viết của bạn để sử dụng định dạng mathjax. Vui lòng kiểm tra lại rằng tôi không vô tình đưa ra bất kỳ lỗi nào.
Sycorax nói Phục hồi lại

Câu hỏi của bạn đang thiếu một câu hỏi thực sự theo như tôi hiểu. Bạn có thể làm rõ những gì bạn muốn? Một khuyến nghị những gì để sử dụng?
Henrik

Xin chào @Henrik, tôi đã quan tâm đến một đề xuất về việc sử dụng cái gì, vâng, nhưng cũng rộng hơn là cách các phương pháp khác nhau so sánh với nhau và sự khác biệt là gì.
Andrew

Tôi tin rằng các phương trình ban đầu và trên là sai. Điều này không phải do những thay đổi của @ user777. Hai thuật ngữ bên phải nên ở mẫu số. Xem này .
Cyrille

Lỗi này có thể đã gây ra do tài liệu gói MuMIn thiếu dấu ngoặc đóng .
Cyrille

Câu trả lời:


11

R2lme4nlme

Tôi phải thừa nhận đã có một chút co giật khi mọi người nói về "R2 cho GLMM". R2 cho một mô hình tuyến tính được xác định rõ và có nhiều đặc tính mong muốn. Đối với các mô hình khác, người ta có thể định nghĩa các đại lượng khác nhau phản ánh một số nhưng không phải tất cả các thuộc tính này. Nhưng đây không phải là tính toán R2 theo nghĩa có được một số có tất cả các thuộc tính mà R2 cho các mô hình tuyến tính thực hiện. Thông thường có một số cách khác nhau mà số lượng như vậy có thể được xác định. Đặc biệt đối với GLM và GLMM trước khi bạn có thể xác định "tỷ lệ phương sai phản hồi được giải thích" trước tiên bạn cần xác định ý của bạn bằng "phương sai phản hồi".

Nhầm lẫn về những gì cấu thành R2 hoặc mức độ tự do của bất kỳ đại lượng nào khác liên quan đến các mô hình tuyến tính khi áp dụng cho các mô hình khác xuất phát từ việc nhầm lẫn công thức với khái niệm này. Mặc dù các công thức có nguồn gốc từ các mô hình, việc tạo đạo hàm thường liên quan đến toán học khá phức tạp. Để tránh dẫn xuất có thể gây nhầm lẫn và chỉ cần "cắt theo đuổi", việc trình bày các công thức sẽ dễ dàng hơn. Nhưng công thức không phải là khái niệm. Khái quát hóa một công thức không tương đương với khái quát hóa khái niệm. Và những công thức đó hầu như không bao giờ được sử dụng trong thực tế, đặc biệt là cho các mô hình tuyến tính tổng quát, phân tích phương sai và hiệu ứng ngẫu nhiên. Tôi có một "định lý meta" rằng đại lượng duy nhất thực sự được tính theo các công thức được đưa ra trong các văn bản giới thiệu là trung bình mẫu.

Có vẻ như tôi là một ông già gắt gỏng về điều này, và có lẽ tôi cũng vậy, nhưng điều nguy hiểm là mọi người mong đợi một số lượng "giống như R2" có tất cả các thuộc tính của R2 cho các mô hình tuyến tính. Nó không thể. Không có cách nào để khái quát tất cả các thuộc tính cho một mô hình phức tạp hơn nhiều như GLMM.

Tôi đã từng ở trong ủy ban xem xét một đề xuất luận án cho Ph.D. ứng cử. Đề xuất là kiểm tra tôi nghĩ rằng 9 công thức khác nhau có thể được coi là cách tính toán R2 cho mô hình hồi quy phi tuyến để quyết định cái nào là "tốt nhất". Tất nhiên, điều này sẽ được thực hiện thông qua một nghiên cứu mô phỏng chỉ với một vài mô hình khác nhau và chỉ một vài bộ giá trị tham số khác nhau cho mỗi mô hình. Tôi đề nghị rằng đây là một bài tập hoàn toàn vô nghĩa không được chào đón nồng nhiệt.


10

R2R2

  • Lahuis, D et al (2014) Giải thích các biện pháp phương sai cho các mô hình đa cấp. Phương pháp nghiên cứu tổ chức.

nhập mô tả hình ảnh ở đây

R2R2R2R2R2R2(OLS) có độ lệch chuẩn thấp nhất trong mô hình độ dốc ngẫu nhiên. Nói chung, Công thức không phải là một công cụ ước tính hiệu quả.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.