Làm cách nào để diễn giải 'mối tương quan của hiệu ứng cố định' trong đầu ra lấp lánh của tôi?


26

Tôi có đầu ra sau:

Generalized linear mixed model fit by the Laplace approximation 
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) 

 AIC   BIC    logLik deviance
 4062  4093  -2022   4044

Random effects:
Groups    Name        Variance Std.Dev.
landscape (Intercept) 0.82453  0.90804 
Number of obs: 239, groups: landscape, 45

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.65120    0.14051  18.868   <2e-16     
sMFS2        0.26922    0.17594   1.530   0.1260    
sAG2         0.09268    0.14529   0.638   0.5235    
sSHDI2       0.28345    0.17177   1.650   0.0989  
sbare        0.41388    0.02976  13.907   <2e-16 
seasonlate  -0.50165    0.02729 -18.384   <2e-16 
cropforage   0.79000    0.06724  11.748   <2e-16 
cropsoy      0.76507    0.04920  15.551   <2e-16 

Correlation of Fixed Effects:
           (Intr) sMFS2  sAG2   sSHDI2 sbare  sesnlt crpfrg
sMFS2      -0.016                                          
sAG2        0.006 -0.342                                   
sSHDI2     -0.025  0.588 -0.169                            
sbare      -0.113 -0.002  0.010  0.004                     
seasonlate -0.034  0.005 -0.004  0.001 -0.283              
cropforage -0.161 -0.005  0.012 -0.004  0.791 -0.231       
cropsoy    -0.175 -0.022  0.013  0.013  0.404 -0.164  0.557

Tất cả các biến liên tục của tôi (được biểu thị bằng một chữ nhỏ strước tên biến) được chuẩn hóa (z-points). seasonlà một biến phân loại có 2 cấp độ (sớm và muộn) và croplà biến phân loại có 3 cấp độ (ngô, thức ăn gia súc và đậu nành).

Mối tương quan này của ma trận hiệu ứng cố định thực sự làm tôi bối rối, bởi vì tất cả các mối tương quan đều có dấu hiệu ngược lại mà chúng làm khi tôi nhìn vào hồi quy đơn giản của các cặp biến. tức là, mối tương quan của ma trận hiệu ứng cố định cho thấy mối tương quan tích cực mạnh mẽ giữa cropforagesbare, trong khi thực tế có mối tương quan NEGECT rất mạnh giữa các biến này - cây trồng thức ăn gia súc có xu hướng ít đất hơn so với cây ngô và đậu nành. Các cặp biến liên tục có cùng một vấn đề, mối tương quan của ma trận hiệu ứng cố định cho biết mọi thứ đều trái ngược với những gì cần có ... Điều này có thể là do sự phức tạp của mô hình (không phải là hồi quy đơn giản)? Nó có thể có một cái gì đó để làm với thực tế là các biến được tiêu chuẩn hóa?

Cảm ơn.

Câu trả lời:


27

Đầu ra "tương quan của hiệu ứng cố định" không có ý nghĩa trực quan mà hầu hết sẽ gán cho nó. Cụ thể, không phải là về mối tương quan của các biến (như ghi chú của OP). Trên thực tế, đó là về mối tương quan dự kiến ​​của các hệ số hồi quy. Mặc dù điều này có thể nói đến đa cộng đồng nhưng nó không nhất thiết phải như vậy. Trong trường hợp này, nó sẽ cho bạn biết rằng nếu bạn đã thực hiện lại thí nghiệm và điều đó đã xảy ra rằng hệ số cho cropforagenhỏ hơn, có khả năng là điều đó cũng sẽ xảy ra sbare.

Trong phần của mình, cuốn sách "Phân tích dữ liệu ngôn ngữ: Giới thiệu thực tế về thống kê sử dụng R" đối phó với lme4 Baayen đã loại bỏ phần đầu ra đó và chỉ tuyên bố nó hữu ích trong các trường hợp đặc biệt. Dưới đây là một thông điệp listerv trong đó chính Bates mô tả cách diễn giải phần đó của đầu ra:

Nó là một mối tương quan gần đúng của công cụ ước tính của các hiệu ứng cố định. (Tôi bao gồm từ "gần đúng" bởi vì tôi nên nhưng trong trường hợp này, phép tính gần đúng là rất tốt.) Tôi không chắc làm thế nào để giải thích nó tốt hơn thế. Giả sử rằng bạn đã lấy một mẫu MCMC từ các tham số trong mô hình, thì bạn sẽ mong đợi mẫu của các tham số hiệu ứng cố định sẽ hiển thị cấu trúc tương quan như ma trận này.


3
Tôi xin lỗi, đây có lẽ sẽ là một câu hỏi ngớ ngẩn, nhưng tại sao điều quan trọng là phải xem xét mối tương quan đó? Ý tôi là, trong những tình huống mà đầu ra nên được xem xét?
mtao

1
@Teresa Nó phụ thuộc vào những gì bạn đang sử dụng nó cho. Nếu bạn quan tâm đến việc giải thích, thì nó sẽ cho bạn biết về hai nguồn hiệu ứng có thể gây nhầm lẫn như thế nào. Nếu bạn quan tâm đến dự đoán, nó sẽ cho bạn biết một chút về các mô hình dự đoán khác có thể trông như thế nào và cung cấp cho bạn một số gợi ý về cách mô hình có thể thay đổi nếu bạn bỏ dự đoán.
russellpierce

1
Vì vậy, hãy tưởng tượng rằng tôi có hai biến trong đầu ra đó với tương quan là 0,90 chẳng hạn. Về mặt giải thích, tôi cho rằng tôi nên bỏ một trong số chúng, bởi vì chúng "dễ hiểu" và dường như đang nói cùng một thông tin. Theo dự đoán, nếu tôi bỏ một trong số chúng, các mô hình khác không nên thay đổi nhiều như vậy, vì chúng có tương quan với nhau không? Hay tôi đang giải thích điều này sai?
mtao

3
Bạn biết đấy, tôi nghĩ rằng bạn đang lặp lại những gì tôi nói chính xác; nhưng, về phản xạ tôi không chắc chắn 100%. Bạn có thể được phục vụ tốt nhất bằng cách mở một câu hỏi mới - điều đó sẽ thu hút nhiều hơn vào câu hỏi của bạn và tăng khả năng bạn nhận được câu trả lời đúng.
russellpierce

1
@russellpierce, cảm ơn vì câu trả lời này. Mặc dù vậy, có một câu hỏi, tôi đã học được rằng tính đa hình xảy ra khi các yếu tố dự đoán tương quan với nhau. Nhưng trong câu trả lời của bạn, bạn nói rằng đó là mối tương quan của các hệ số hồi quy (không phải của các yếu tố dự đoán) có thể nói lên tính đa hình. Tại sao không chỉ tương quan với các yếu tố dự đoán thay vì các hệ số ước tính?
quỹ tích

0

Nếu mối tương quan tiêu cực và tích cực của bạn giống nhau về giá trị của chúng và chỉ có dấu hiệu của chúng khác nhau, thì bạn đang nhập sai biến. Nhưng tôi không nghĩ rằng đây là trường hợp của bạn vì bạn đã có vẻ khá tiến bộ về chỉ số.

Sự không nhất quán mà bạn đang gặp phải có thể và có khả năng gây ra bởi tính đa hình. Nó có nghĩa là khi một số biến độc lập chia sẻ một số hiệu ứng chồng chéo, hay nói cách khác là tương quan với nhau. ví dụ mô hình hóa các biến "tốc độ tăng trưởng" và "kích thước khối u" có thể gây ra đa hình, vì có thể và có khả năng các khối u lớn hơn có tốc độ tăng trưởng cao hơn (trước khi chúng được phát hiện) mỗi lần. Điều này có thể gây nhầm lẫn cho mô hình. Và nếu mô hình của bạn có một vài biến độc lập tương quan với nhau, việc diễn giải kết quả đôi khi có thể trở nên khá khó khăn. Đôi khi nó dẫn đến các hệ số hoàn toàn kỳ lạ, thậm chí đến mức độ mà dấu hiệu của một số tương quan đảo ngược.

Trước tiên, bạn nên phát hiện các nguồn của đa cộng đồng và đối phó với chúng và sau đó chạy lại phân tích của bạn.


1
-1; gây hiểu lầm. OP đã không nhập các biến của mình không chính xác và tính đa hình có thể không phải là vấn đề. Một mối tương quan giữa các hiệu ứng cố định thô có thể nói lên điểm này, nhưng nghịch lý của Simpson có thể cho phép cách tiếp cận đó đưa bạn đi sai hướng.
russellpierce

1
Tại sao "gây hiểu lầm"? Phần nào đã gây hiểu nhầm? Tôi đã nói chuyện rất rõ ràng và tránh suy luận ra kết luận rõ ràng. Những gì tôi nói thực sự là một trong những dấu hiệu đa cộng đồng và nói với chúng ta rằng chúng ta cũng nên kiểm tra VIF. Nhưng tôi không hiểu làm thế nào bạn biết hoặc chắc chắn rằng "OP đã không nhập sai các biến của anh ấy và tính đa hình có thể không phải là vấn đề."?
Vic

1
Bên cạnh đó, bạn thậm chí chưa đọc bài viết của tôi hoàn toàn (và đánh giá thấp nó và gọi nó là sai lệch). Nếu bạn đã có, bạn đã thấy rằng tôi đã đề nghị OP nên kiểm tra VIF (là chỉ số chính thức cho multiC) để đảm bảo liệu những tương quan cao đó có thực sự hướng đến MC hay không? nhưng dù sao, tôi vẫn mở để học miễn là nó không kiêu ngạo và tấn công cá nhân.
Vic

1
@Vic: Không thấy bình luận của bạn cho đến bây giờ. Tôi không có ý cho bạn xem phản ứng của tôi như một cuộc tấn công cá nhân. Tôi cho rằng đó là sai lệch và tôi đã cung cấp những gì tôi tin là câu trả lời đúng ở trên. Tôi đọc toàn bộ bài viết của bạn tại thời điểm đó. Tôi không biết liệu tôi có đào sâu vào các bình luận hay không. Tôi đứng bên cạnh downvote của tôi.
russellpierce

1
... nhưng tôi cho phép tôi có thể bị nhầm lẫn trong bản án đó. Tuy nhiên, có vẻ tốt hơn để giải thích lý do tại sao tôi hạ cấp hơn là chỉ downvote.
russellpierce

0

Có thể hữu ích để chỉ ra rằng những mối tương quan giữa các hiệu ứng cố định có được bằng cách chuyển đổi "vcov" của mô hình thành ma trận tương quan. Nếu fitlà mô hình lme4 được trang bị của bạn, thì

vc <- vcov(fit)

# diagonal matrix of standard deviations associated with vcov
S <- sqrt(diag(diag(vc), nrow(vc), nrow(vc)))

# convert vc to a correlation matrix
solve(S) %*% vc %*% solve(S)

và mối tương quan giữa các hiệu ứng cố định là các mục ngoài đường chéo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.