Hệ số tương quan Intraclass trong mô hình hỗn hợp với độ dốc ngẫu nhiên


10

Tôi có mô hình sau m_plotđược trang bị lme4::lmercác hiệu ứng ngẫu nhiên chéo cho người tham gia ( lfdn) và vật phẩm ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Tôi muốn biết Hệ số tương quan nội bộ (ICC) cho người tham gia và vật phẩm. Nhờ câu trả lời tuyệt vời này, về nguyên tắc, tôi biết cách lấy ICC cho mô hình của mình. Tuy nhiên, tôi không chắc chắn về việc có bao gồm các sườn ngẫu nhiên hay không:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Các biện pháp thích hợp cho mối tương quan giữa hai câu trả lời từ cùng một người tham gia tương ứng với cùng một mục là gì?


1
Merlo et al 2005 "Một hướng dẫn khái niệm ngắn gọn về phân tích đa cấp trong dịch tễ học xã hội: điều tra các hiện tượng theo ngữ cảnh ở các nhóm người khác nhau" có thể là một tài liệu tham khảo hữu ích.
N Brouwer

@Henrik bạn đã bao giờ tìm thấy câu trả lời cho câu hỏi này chưa? Tôi cũng quan tâm.
Patrick S. Forscher

2
@ PatrickS.Forscher Theo tôi hiểu, ICC không có ý nghĩa với độ dốc ngẫu nhiên. Tôi đã học được điều này từ Jake Westfall.
Henrik

Có một liên kết đến một đọc đọc có liên quan tình cờ?
Patrick S. Forscher

1
@ PatrickS.Forscher Như bạn có thể thấy, Jake Westfall hiện cung cấp một câu trả lời tuyệt vời.
Henrik

Câu trả lời:


8

Về cơ bản không có một con số hoặc ước tính nào có thể tóm tắt mức độ phân cụm trong một mô hình độ dốc ngẫu nhiên.

Mối tương quan giữa các lớp (ICC) chỉ có thể được viết dưới dạng một tỷ lệ phương sai đơn giản trong các mô hình chỉ chặn ngẫu nhiên. Để xem tại sao, một bản phác thảo về đạo hàm của biểu thức ICC có thể được tìm thấy ở đây .

Khi bạn ném các sườn ngẫu nhiên vào phương trình mô hình, theo các bước tương tự dẫn đến biểu thức ICC trên trang 5 của bài viết này . Như bạn có thể thấy, biểu thức phức tạp đó là một chức năng của yếu tố dự đoán X. Để thấy trực quan hơn tại sao var (Y) phụ thuộc vào X khi có độ dốc ngẫu nhiên, hãy xem trang 30 của các slide này ("Tại sao phương sai phụ thuộc vào x ? ") .

Vì ICC là một hàm của các yếu tố dự đoán (giá trị x), nên nó chỉ có thể được tính cho các bộ giá trị x cụ thể. Có lẽ bạn có thể thử một cái gì đó như báo cáo ICC ở mức trung bình chung của các giá trị x, nhưng ước tính này sẽ không chính xác cho phần lớn các quan sát.

Tất cả mọi thứ tôi đã nói vẫn chỉ đề cập đến các trường hợp có một yếu tố ngẫu nhiên duy nhất. Với nhiều yếu tố ngẫu nhiên, nó trở nên phức tạp hơn. Ví dụ: trong một dự án nhiều trang web nơi người tham gia tại mỗi trang web phản hồi một mẫu kích thích (nghĩa là 3 yếu tố ngẫu nhiên: trang web, người tham gia, kích thích), chúng tôi có thể hỏi về nhiều ICC khác nhau: Mối tương quan dự kiến ​​giữa hai phản hồi là gì tại cùng một địa điểm, đến cùng một kích thích, từ những người tham gia khác nhau? Làm thế nào về các trang web khác nhau, cùng một kích thích, và những người tham gia khác nhau? Và như thế. @rvl đề cập đến các biến chứng này trong câu trả lời mà OP liên kết đến.

Vì vậy, như bạn có thể thấy, trường hợp duy nhất mà chúng ta có thể tóm tắt mức độ phân cụm với một giá trị duy nhất là trường hợp chỉ đánh chặn ngẫu nhiên yếu tố ngẫu nhiên đơn lẻ. Bởi vì đây là một tỷ lệ nhỏ trong các trường hợp thực tế, ICC không phải là hữu ích trong hầu hết thời gian. Vì vậy, khuyến nghị chung của tôi là thậm chí không lo lắng về họ. Thay vào đó tôi khuyên bạn chỉ nên báo cáo các thành phần phương sai (tốt nhất là ở dạng lệch chuẩn).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.