Cấu trúc G cấu trúc G trong glmm là gì?


16

Tôi đã sử dụng MCMCglmmgói gần đây. Tôi bối rối bởi những gì được đề cập trong tài liệu là cấu trúc R và cấu trúc G. Chúng dường như liên quan đến các hiệu ứng ngẫu nhiên - đặc biệt chỉ định các tham số cho phân phối trước trên chúng, nhưng cuộc thảo luận trong tài liệu dường như cho rằng người đọc biết những thuật ngữ này là gì. Ví dụ:

danh sách tùy chọn các thông số kỹ thuật trước có 3 yếu tố có thể: R (cấu trúc R) G (cấu trúc G) và B (hiệu ứng cố định) ............ Các linh mục cho cấu trúc phương sai (R và G ) là các danh sách có phương sai (đồng) dự kiến ​​(V) và mức độ của tham số niềm tin (nu) cho nghịch đảo-Wishart

... Lấy từ đây .

EDIT: Xin lưu ý rằng tôi đã viết lại phần còn lại của câu hỏi sau các ý kiến ​​từ Stephane.

Bất cứ ai cũng có thể làm sáng tỏ cấu trúc R và cấu trúc G là gì, trong bối cảnh mô hình thành phần phương sai đơn giản trong đó bộ dự báo tuyến tính là

β0+e0ij+u0j
với e0ijN(0,σ0e2)u0jN(0,σ0u2)

Tôi đã làm ví dụ sau với một số dữ liệu đi kèm MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

Vì vậy, dựa trên các nhận xét từ Stephane, tôi nghĩ rằng cấu trúc G dành cho . Nhưng các ý kiến ​​cũng nói rằng cấu trúc R dành cho σ 2 0 e nhưng điều này dường như không xuất hiện trong đầu ra.σ0u2σ0e2lme4

Lưu ý rằng kết quả từ lme4/glmer()phù hợp với cả hai ví dụ từ MCMC MCMCglmm.

Vì vậy, cấu trúc R cho và tại sao điều này không xuất hiện trong đầu ra cho ?σ0e2lme4/glmer()


1
Với thuật ngữ SAS (nhưng có thể là thuật ngữ phổ biến hơn), ma trận G là ma trận phương sai của các hiệu ứng ngẫu nhiên và ma trận R là ma trận phương sai của "thuật ngữ lỗi" (trong trường hợp của bạn có lẽ nó là phần dư ước tính phương sai σ0e2 )?
Stéphane Laurent

@ StéphaneLaurent cảm ơn bạn. Tôi tự hỏi liệu nó có thể được ước tính nhưng khi tôi mới biết về mô hình tuyến tính tổng quát, tôi nhớ rằng σ 2 0 e không được ước tính - chỉ tính "độ lệch" (như với ). Có lẽ tôi đang thiếu một cái gì đó? σ0e2σ0e2lme4
Joe King

1
có lẽ ý nghĩa của phương sai còn lại là không rõ ràng khi gia đình phân phối không phải là người Gaussian
Stéphane Laurent

1
@ Stéphane Laurent Có! Vui lòng xem nhận xét của tôi về câu trả lời của Michael một phút trước - đối với kết quả nhị phân, cần khắc phục (như trong các mô hình của tôi trong OP của tôi)
Joe King

1
Khi bạn có một mô hình ME / Đa cấp, có một số phương sai. Hãy tưởng tượng trường hợp đơn giản: . Có sự khác nhau trong các lần chặn b i và trong thuật ngữ lỗi ε i . G thường được sử dụng cho ma trận var-covar của các hiệu ứng ngẫu nhiên (trong trường hợp này là vô hướng, σ 2 b ) & R i dành cho ma trận var-covar của phương sai dư ε iYi=β0+β1X+bi+εibiεiGσb2Riεisau khi tính toán các hiệu ứng ngẫu nhiên và cố định của cụm đó. Nó thường được hình thành dưới dạng ma trận đường chéo của 's. Ngoài ra, cả hai dists đều được coi là đa biến bình thường w / mean = 0. σ2
gung - Phục hồi Monica

Câu trả lời:


8

Tôi muốn đăng bình luận của tôi dưới đây như một bình luận nhưng điều này là không đủ. Đây là những câu hỏi chứ không phải là một câu trả lời (mô phỏng theo @gung tôi không cảm thấy đủ mạnh về chủ đề này).

Tôi có ấn tượng rằng MCMCglmm không thực hiện glmmian "thật". Mô hình Bayes thực sự được mô tả trong phần 2 của bài viết này . Tương tự như mô hình thường xuyên, người ta có và có một yêu cầu trước về tham số phân tán ϕ 1g(E(yu))=Xβ+Zuϕ1 , thêm vào các thông số cố định và "G" phương sai của các hiệu ứng ngẫu nhiên u .βu

Nhưng theo họa tiết MCMCglmm này , mô hình được triển khai trong MCMCglmm được cho bởi và nó không liên quan đến tham số phân tán ϕ 1 . Nó không giống với mô hình thường xuyên cổ điển.g(E(yu,e))=Xβ+Zu+eϕ1

Do đó, tôi sẽ không ngạc nhiên khi không có sự tương tự của với ánh sáng.σe

Xin lỗi vì những bình luận thô bạo này, tôi chỉ xem nhanh về điều đó.


Cảm ơn bạn. Có phải chủ đề này là khó khăn, bởi vì tôi thấy nó khá khó? Tôi nghĩ rằng tôi hài lòng với ý nghĩa của cấu trúc R và G bây giờ. Tôi vẫn còn bối rối về việc thiếu với và tôi rất tò mò về nhận xét của bạn không thực sự là Bayes. Tôi không thể thành thật nói rằng tôi hiểu tất cả các bài báo mà bạn liên kết đến và tôi cũng đang phải vật lộn với các bộ phận của các họa tiết, nhưng chỉ thuần túy từ quan điểm của ví dụ của tôi, tôi tin rằng các tham số phân tán φ 1 nên không đổi (vì ví dụ là nhị thức). Tôi đang thiếu gì? σeglmerMCMCglmmMCMCglmmϕ1
Joe King

Xin lỗi, lời nói của tôi không hoàn toàn phù hợp. MCMCglmm thực sự là Bayes, nhưng nó không thực hiện chính xác glmm cổ điển (tôi nghĩ). Ngoài ra, bạn phải nhận thức được rằng rất khó để thiết lập các linh mục mang lại một suy luận về các thành phần phương sai gần với suy luận thường xuyên.
Stéphane Laurent

Cảm ơn một lần nữa. Trong nghiên cứu của tôi, tôi đã phát hiện ra rằng tôi có thể sử dụng phân phối nghịch đảo mặc định cho các thành phần phương sai trong MCMCglmmviệc sử dụng nhiều tham số khác nhau và khoảng tin cậy 95% luôn chứa giá trị phương sai cho ước tính hiệu ứng ngẫu nhiên glmervì vậy tôi cảm thấy rằng điều này là hợp lý , nhưng tôi nên giải thích trường hợp này như thế nào, có thể không điển hình, trong đó kết quả là các MCMCglmmkhoảng không quá nhạy cảm với lựa chọn trước? Có lẽ tôi nên hỏi một câu hỏi mới về điều này?
Joe King

σe=0σe0

σeσeσuglmer

11

Rσe21 (cũng đúng với mô hình probit). Đối với dữ liệu đếm (ví dụ: với phân phối poisson), bạn không sửa nó và điều này sẽ tự động ước tính một tham số quá mức về cơ bản.

GG .

Một lưu ý cuối cùng, vì phương sai dư không được cố định ở mức 0, các ước tính sẽ không khớp với các phương sai từ glmer. Bạn cần phải giải cứu họ. Dưới đây là một ví dụ nhỏ (không sử dụng hiệu ứng ngẫu nhiên, nhưng nó khái quát). Lưu ý cách phương sai cấu trúc R được cố định ở 1.

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

Đây là hằng số thay đổi kích thước cho họ nhị thức:

k <- ((16*sqrt(3))/(15*pi))^2

Bây giờ chia giải pháp cho nó và nhận các chế độ sau

posterior.mode(m2$Sol/(sqrt(1 + k)))

Mà nên khá gần với những gì chúng ta nhận được từ glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

bạn có biết làm thế nào để xác định độ không đồng nhất ở cấp độ một trong MCMCglmm không? Có phải đó là cấu trúc R? Cú pháp sau đó là gì?
Maxim.K

@Joshua, bạn có thể giải thích "hằng số thay đổi kích thước cho gia đình nhị thức" không? PS: Đối với hạt giống 123, tôi nhận được (với sự điều chỉnh) từ m2các giá trị -8.1640.421; và từ glmcác giá trị -8.8330.430.
Qaswed

Hằng số thay đổi kích thước có thể được tìm thấy trong Diggle et. al. ( amazon.de/Analysis-Longitudinal-Oxford-Statistic-Science/dp/ .) - theo cran.r-project.org/web/packages/MCMCglmm/vignettes/ cách eq. 2,14 trên trang 47.
Qaswed
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.