Về tiện ích của tương quan độ dốc chặn trong các mô hình đa cấp


8

Trong cuốn sách "Phân tích đa cấp: Giới thiệu về mô hình đa cấp cơ bản và nâng cao" (1999), Snijder & Bosker (ch. 8, mục 8.2, trang 119) đã nói rằng mối tương quan giữa độ dốc chặn, được tính như là hiệp phương sai giữa các đường dốc bởi căn bậc hai của sản phẩm của phương sai đánh chặn và phương sai độ dốc, không bị giới hạn giữa -1 và +1 và thậm chí có thể là vô hạn.

Vì điều này, tôi đã không nghĩ rằng tôi nên tin tưởng nó. Nhưng tôi có một ví dụ để minh họa. Trong một phân tích của tôi, có chủng tộc (phân đôi), tuổi và tuổi * là hiệu ứng cố định, đoàn hệ là hiệu ứng ngẫu nhiên và biến nhị phân chủng tộc là độ dốc ngẫu nhiên, chuỗi phân tán của tôi cho thấy độ dốc không thay đổi nhiều theo các giá trị của biến cụm (ví dụ, đoàn hệ) của tôi và tôi không thấy độ dốc trở nên ít hơn hoặc dốc hơn trên các đoàn hệ. Thử nghiệm tỷ lệ khả năng cũng cho thấy sự phù hợp giữa các mô hình độ dốc ngẫu nhiên và độ dốc ngẫu nhiên là không đáng kể mặc dù tổng kích thước mẫu của tôi (N = 22.156). Tuy nhiên, mối tương quan giữa độ dốc chặn là gần -0,80 (điều này cho thấy sự hội tụ mạnh mẽ về sự khác biệt nhóm trong biến Y theo thời gian, tức là, qua các đoàn hệ).

Tôi nghĩ đó là một minh họa tốt về lý do tại sao tôi không tin vào mối tương quan giữa độ dốc, trên hết những gì Snijder & Bosker (1999) đã nói.

Chúng ta có nên thực sự tin tưởng và báo cáo mối tương quan giữa độ dốc trong các nghiên cứu đa cấp độ? Cụ thể, tính hữu ích của mối tương quan đó là gì?

EDIT 1: Tôi không nghĩ nó sẽ trả lời câu hỏi của tôi, nhưng tôi đã yêu cầu tôi cung cấp thêm thông tin. Xem dưới đây, nếu nó giúp.

Dữ liệu được lấy từ Khảo sát xã hội chung. Đối với cú pháp, tôi đã sử dụng Stata 12, vì vậy nó đọc:

xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml cov(un) var
  • wordsum là điểm kiểm tra từ vựng (0-10),
  • bw1 là biến dân tộc (đen = 0, trắng = 1),
  • aged1-aged9 là các biến số của tuổi,
  • bw1aged1-bw1aged9 là sự tương tác giữa dân tộc và tuổi tác,
  • cohort21 là biến đoàn hệ của tôi (21 loại, được mã hóa từ 0 đến 20).

Đầu ra đọc:

    . xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml 
> cov(un) var

Performing EM optimization: 

Performing gradient-based optimization: 

Iteration 0:   log restricted-likelihood = -46809.738  
Iteration 1:   log restricted-likelihood = -46809.673  
Iteration 2:   log restricted-likelihood = -46809.673  

Computing standard errors:

Mixed-effects REML regression                   Number of obs      =     22156
Group variable: cohort21                        Number of groups   =        21

                                                Obs per group: min =       307
                                                               avg =    1055.0
                                                               max =      1728


                                                Wald chi2(17)      =   1563.31
Log restricted-likelihood = -46809.673          Prob > chi2        =    0.0000

------------------------------------------------------------------------------
     wordsum |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         bw1 |   1.295614   .1030182    12.58   0.000     1.093702    1.497526
       aged1 |  -.7546665    .139246    -5.42   0.000    -1.027584   -.4817494
       aged2 |  -.3792977   .1315739    -2.88   0.004    -.6371779   -.1214175
       aged3 |  -.1504477   .1286839    -1.17   0.242    -.4026635     .101768
       aged4 |  -.1160748   .1339034    -0.87   0.386    -.3785207    .1463711
       aged6 |  -.1653243   .1365332    -1.21   0.226    -.4329245     .102276
       aged7 |  -.2355365    .143577    -1.64   0.101    -.5169423    .0458693
       aged8 |  -.2810572   .1575993    -1.78   0.075    -.5899461    .0278318
       aged9 |  -.6922531   .1690787    -4.09   0.000    -1.023641   -.3608649
    bw1aged1 |  -.2634496   .1506558    -1.75   0.080    -.5587297    .0318304
    bw1aged2 |  -.1059969   .1427813    -0.74   0.458    -.3858431    .1738493
    bw1aged3 |  -.1189573   .1410978    -0.84   0.399     -.395504    .1575893
    bw1aged4 |    .058361   .1457749     0.40   0.689    -.2273525    .3440746
    bw1aged6 |   .1909798   .1484818     1.29   0.198    -.1000393    .4819988
    bw1aged7 |   .2117798    .154987     1.37   0.172    -.0919891    .5155486
    bw1aged8 |   .3350124    .167292     2.00   0.045     .0071262    .6628987
    bw1aged9 |   .7307429   .1758304     4.16   0.000     .3861217    1.075364
       _cons |   5.208518   .1060306    49.12   0.000     5.000702    5.416334
------------------------------------------------------------------------------

------------------------------------------------------------------------------
  Random-effects Parameters  |   Estimate   Std. Err.     [95% Conf. Interval]
-----------------------------+------------------------------------------------
cohort21: Unstructured       |
                    var(bw1) |   .0049087    .010795      .0000659    .3655149
                  var(_cons) |   .0480407   .0271812      .0158491     .145618
              cov(bw1,_cons) |  -.0119882    .015875     -.0431026    .0191262
-----------------------------+------------------------------------------------
               var(Residual) |   3.988915   .0379483      3.915227     4.06399
------------------------------------------------------------------------------
LR test vs. linear regression:       chi2(3) =    85.83   Prob > chi2 = 0.0000

Note: LR test is conservative and provided only for reference.

Scatterplot tôi sản xuất được hiển thị dưới đây. Có chín ô phân tán, một cho mỗi loại biến tuổi của tôi.

nhập mô tả hình ảnh ở đây

EDIT 2:

. estat recovariance

Random-effects covariance matrix for level cohort21

             |       bw1      _cons 
-------------+----------------------
         bw1 |  .0049087            
       _cons | -.0119882   .0480407

Có một điều nữa tôi muốn nói thêm: Điều làm phiền tôi là, liên quan đến hiệp phương sai / tương quan độ dốc, Joop J. Hox (2010, trang 90) trong cuốn sách "Các kỹ thuật và ứng dụng phân tích đa cấp, Ấn bản thứ hai" nói rằng :

Sẽ dễ dàng hơn để giải thích hiệp phương sai này nếu nó được trình bày như là một mối tương quan giữa phần dư chặn và độ dốc. ... Trong một mô hình không có các yếu tố dự đoán khác ngoại trừ biến thời gian, mối tương quan này có thể được hiểu là một mối tương quan thông thường, nhưng trong mô hình 5 và 6, nó là một mối tương quan một phần, có điều kiện dựa trên các yếu tố dự đoán trong mô hình.

Vì vậy, dường như không phải ai cũng đồng ý với Snijder & Bosker (1999, trang 119), người tin rằng "ý tưởng về mối tương quan không có ý nghĩa ở đây" bởi vì nó không bị ràng buộc giữa [-1, 1].


Bạn có thể gửi các lô? Bạn có thể thêm một số thông tin về dữ liệu của bạn và mô hình của bạn? Bạn có thể đăng đầu ra từ phân tích & mã được sử dụng để tạo ra nó không?
gung - Phục hồi Monica

Cảm ơn bình luận của bạn gung. Tôi không nghĩ rằng nó trả lời câu hỏi của tôi về tiện ích của "mối tương quan" độ dốc chặn nhưng tôi đã chỉnh sửa Q của mình và thêm thông tin bạn yêu cầu. Tôi hy vọng nó sẽ giúp dù sao.
Mạnh Hồ

Cảm ơn bạn, Mạnh Hồ. Tôi không biết liệu nó có giúp được mọi người hay không, nhưng nó có thể, và nó sẽ không bị tổn thương.
gung - Phục hồi Monica

Không có cuốn sách, tôi tự hỏi nếu họ nói rằng về hiệp phương sai của độ dốc & đánh chặn, không phải là mối tương quan. Với N = 22k, bạn không thể đăng BLUP, nhưng bạn có thể đăng ma trận phương sai hiệp phương sai của họ không? Tôi tập hợp bạn đang sử dụng Stata, điều mà tôi không biết, nhưng điều đó là có thể.
gung - Phục hồi Monica

Phương sai hiệp phương sai của các hiệu ứng ngẫu nhiên nên được hiển thị trong đầu ra tôi đã thêm trước đó. Nhưng tôi đã chỉnh sửa lại câu hỏi. Điều này đang được nói, tôi không nhớ Snijder & Bosker (1999) đã nói bất cứ điều gì cụ thể về hiệp phương sai độ dốc. Họ nói rằng chúng ta nên luôn luôn đưa nó vào một mô hình độ dốc ngẫu nhiên. Họ cũng giải thích ý nghĩa của việc có một hệ số âm / dương cho hiệp phương sai đó. Nhưng đó là tất cả, tôi nghĩ. Nhân tiện, tôi cũng đã thêm đoạn từ Hox (2010), người tin rằng mối tương quan giữa độ dốc có thể được hiểu là một mối tương quan thông thường.
Mạnh Hồ

Câu trả lời:


4

Tôi đã gửi email cho một số học giả (gần 30 người) vài tuần trước. Rất ít trong số họ gửi thư của họ (luôn luôn là email tập thể). Eugene Demidenko là người đầu tiên trả lời:

cov / sqrt (var1 * var2) luôn nằm trong [-1,1] bất kể giải thích: đó có thể là ước tính của chặn và độ dốc, hai độ dốc, v.v ... Thực tế là -1 <= cov / sqrt (var1 * var2 ) <= 1 theo sau bất đẳng thức Cauchy và nó luôn luôn đúng. Vì vậy, tôi bác bỏ tuyên bố Snijder & Bosker. Có lẽ một số thông tin khác bị thiếu?

Điều này được theo sau bởi một email từ Thomas Snijder:

Thông tin còn thiếu là những gì thực sự được viết về điều này trên trang 122, 123, 124, 129 của Snijder & Bosker (tái bản lần 2 năm 2012). Đây không phải là về hai tuyên bố cạnh tranh trong đó không có nhiều hơn một có thể đúng, đó là về hai cách hiểu khác nhau.

Trên P. 123 một hàm phương sai bậc hai được giới thiệu, \ sigma_0 ^ 2 + 2 \ sigma_ {01} * x + \ sigma_1 ^ 2 * x ^ 2 và nhận xét sau đây được đưa ra: "Công thức này có thể được sử dụng mà không cần giải thích rằng \ sigma_0 ^ 2 và \ sigma_1 ^ 2 là phương sai và \ sigma_ {01} là hiệp phương sai, các tham số này có thể là bất kỳ số nào. Công thức chỉ ngụ ý rằng phương sai còn lại là hàm bậc hai của x.

Hãy để tôi trích dẫn một đoạn đầy đủ của p. 129, về một hàm phương sai bậc hai ở cấp hai; lưu ý rằng MỘT M INTER INTERPRET mà \ tau_0 ^ 2 và \ tau_1 ^ 2 là phương sai hai cấp độ của giao thoa ngẫu nhiên và độ dốc ngẫu nhiên và \ tau_ {01} là hiệp phương sai của chúng, nhưng điều này rõ ràng được đặt phía sau đường chân trời:

"Các tham số \ tau_0 ^ 2, \ tau_1 ^ 2 và \ tau_ {01}, như trong phần trước, không được hiểu là phương sai và hiệp phương sai tương ứng. Việc giải thích là do hàm phương sai (8.7) ) [lưu ý ts: trong cuốn sách này được báo cáo nhầm là 8.8]. Do đó, không bắt buộc \ tau_ {01} ^ 2 <= \ tau_0 ^ 2 * \ tau_1 ^ 2. Để đặt nó theo một cách khác, 'tương quan' được định nghĩa chính thức bởi \ tau_ {01} / (\ tau_0 * \ tau_1) có thể lớn hơn 1 hoặc nhỏ hơn -1, thậm chí là vô hạn, vì ý tưởng về mối tương quan không có ý nghĩa ở đây. Một ví dụ về điều này được cung cấp bởi Hàm phương sai tuyến tính mà \ tau_1 ^ 2 = 0 và chỉ các tham số \ tau_0 ^ 2 và \ tau_ {01} được sử dụng. "

Hàm phương sai là hàm bậc hai của x (biến "có độ dốc ngẫu nhiên") và phương sai của kết quả là giá trị này cộng với phương sai cấp 1. Miễn là điều này là dương đối với tất cả x, phương sai mô hình là dương. (Một yêu cầu bổ sung là ma trận hiệp phương sai tương ứng là xác định dương.)

Một số nền tảng khác của điều này là sự tồn tại của sự khác biệt trong các thuật toán ước tính tham số trong phần mềm. Trong một số phần mềm đa cấp (hiệu ứng ngẫu nhiên), yêu cầu được đưa ra là ma trận hiệp phương sai của các hiệu ứng ngẫu nhiên là bán xác định dương trên tất cả các cấp. Trong phần mềm khác, yêu cầu chỉ được đưa ra là ma trận hiệp phương sai ước tính cho dữ liệu được quan sát là bán xác định dương. Điều này ngụ ý rằng ý tưởng về các hệ số ngẫu nhiên của các biến tiềm ẩn bị từ bỏ và mô hình chỉ định một cấu trúc hiệp phương sai nhất định cho dữ liệu được quan sát; không nhiều không ít; trong trường hợp đó, việc giải thích trích dẫn của Joop Hox không được áp dụng. Lưu ý rằng Harvey Goldstein từ lâu đã sử dụng các hàm phương sai tuyến tính ở cấp một, được biểu thị bằng phương sai độ dốc bằng 0 và tương quan chặn độ dốc khác không ở cấp độ một; điều này đã và được gọi là "biến thể phức tạp"; xem, ví dụ, http://www.bristol.ac.uk/media-l Library / sites / cmm / memory / document / modelling-complex-variation.pdf

Và sau đó, Joop Hox trả lời:

Trong phần mềm MLwiN, thực tế có thể ước tính một thuật ngữ hiệp phương sai và đồng thời ràng buộc một trong các phương sai về 0, điều này sẽ làm cho "mối tương quan" trở nên vô hạn. Và vâng, một số phần mềm sẽ cho phép các ước tính như phương sai âm (phần mềm SEM thường cho phép điều này). Vì vậy, tuyên bố của tôi không hoàn toàn chính xác. Tôi đã đề cập đến cấu trúc ngẫu nhiên "bình thường" không cấu trúc. Hãy để tôi nói thêm rằng nếu bạn thay đổi biến có độ dốc ngẫu nhiên để có điểm 0 khác nhau, phương sai và hiệp phương sai thường thay đổi. Vì vậy, mối tương quan chỉ có thể hiểu được nếu biến dự đoán có điểm 0 cố định, tức là được đo trên thang tỷ lệ. Điều này áp dụng cho các mô hình đường cong tăng trưởng, trong đó mối tương quan giữa trạng thái ban đầu và tốc độ tăng trưởng đôi khi được diễn giải. Trong trường hợp đó, giá trị 0 phải là '

Và anh ấy đã gửi một mail khác:

Dù sao, tôi nghĩ rằng lời giải thích của Tom dưới đây phù hợp với phong cách hợp tác của Snijder / Bosker hơn là phong cách không chính thức của tôi. Tôi sẽ thêm vào trang 90 một chú thích ghi rõ điều gì đó như "Lưu ý rằng các giá trị tham số trong phần ngẫu nhiên là ước tính. Giải thích các hiệp phương sai được tiêu chuẩn hóa như các tương quan thông thường giả định rằng không có ràng buộc nào về phương sai và phần mềm không cho phép ước tính âm. Nếu phần ngẫu nhiên không có cấu trúc thì việc giải thích là phương sai (đồng) thông thường có thể sử dụng được. ".

Lưu ý rằng tôi đã viết về việc giải thích tương quan trong chương dọc. Trong mô hình đường cong tăng trưởng, rất khó để giải thích mối tương quan này là kết quả thực chất và điều đó rất nguy hiểm vì giá trị phụ thuộc vào "số liệu thời gian". Nếu bạn quan tâm đến điều đó, tôi khuyên bạn nên truy cập trang web của Lesa Hoffman ( http://www.lesahoffman.com/ ).

Vì vậy, tôi nghĩ trong tình huống của mình, nơi tôi đã chỉ định một hiệp phương sai không có cấu trúc cho các hiệu ứng ngẫu nhiên, tôi nên hiểu mối tương quan giữa độ dốc là một mối tương quan thông thường.


FYI, cho dù bạn nên đề cập đến ai đó như một scholarhoặc một researchercó thể được thiết lập bằng cách xem CV của họ. Nếu họ liệt kê sách trước (và không có bất kỳ bài báo nào trong các tạp chí đánh giá ngang hàng ... như trường hợp nhân văn), thì chắc chắn là như vậy scholars. Nếu họ liệt kê các giấy tờ và / hoặc trợ cấp đầu tiên, họ là researchers.
StasK

@StasK, tại sao bạn nói rằng các tạp chí trong nhân văn không được đánh giá ngang hàng? Tôi nghĩ rằng họ là. Ví dụ: Triết học cổ điển , Châu Âu thời trung cổ - đây là những từ đầu tiên tôi tìm thấy từ khóa ngẫu nhiên tại Google Scholar Metrics. Tôi đã kiểm tra nhiều hơn và tất cả đều có vẻ như được đánh giá ngang hàng.
amip

Tôi chỉ nói rằng mọi người viết sách chứ không phải là giấy tờ cho các tạp chí đánh giá ngang hàng. Tôi không có nghi ngờ rằng các tạp chí đánh giá ngang hàng nhân văn tồn tại.
StasK

1

Tôi chỉ có thể hoan nghênh nỗ lực của bạn trong việc kiểm tra với những người trong lĩnh vực này. Tôi muốn chỉ là một nhận xét nhỏ liên quan đến tiện ích của mối tương quan giữa đánh chặn và độ dốc. Skrondal và Rabe-Hesketh (2004) đưa ra một ví dụ đơn giản, ngớ ngẩn về cách người ta có thể điều khiển mối tương quan đó bằng cách dịch chuyển / định tâm của biến đi vào mô hình với độ dốc ngẫu nhiên. Xem p. 54 - tìm kiếm "Hình 3.1" trong bản xem trước của Amazon. Nó có giá trị ít nhất vài chục từ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.