Trong cuốn sách "Phân tích đa cấp: Giới thiệu về mô hình đa cấp cơ bản và nâng cao" (1999), Snijder & Bosker (ch. 8, mục 8.2, trang 119) đã nói rằng mối tương quan giữa độ dốc chặn, được tính như là hiệp phương sai giữa các đường dốc bởi căn bậc hai của sản phẩm của phương sai đánh chặn và phương sai độ dốc, không bị giới hạn giữa -1 và +1 và thậm chí có thể là vô hạn.
Vì điều này, tôi đã không nghĩ rằng tôi nên tin tưởng nó. Nhưng tôi có một ví dụ để minh họa. Trong một phân tích của tôi, có chủng tộc (phân đôi), tuổi và tuổi * là hiệu ứng cố định, đoàn hệ là hiệu ứng ngẫu nhiên và biến nhị phân chủng tộc là độ dốc ngẫu nhiên, chuỗi phân tán của tôi cho thấy độ dốc không thay đổi nhiều theo các giá trị của biến cụm (ví dụ, đoàn hệ) của tôi và tôi không thấy độ dốc trở nên ít hơn hoặc dốc hơn trên các đoàn hệ. Thử nghiệm tỷ lệ khả năng cũng cho thấy sự phù hợp giữa các mô hình độ dốc ngẫu nhiên và độ dốc ngẫu nhiên là không đáng kể mặc dù tổng kích thước mẫu của tôi (N = 22.156). Tuy nhiên, mối tương quan giữa độ dốc chặn là gần -0,80 (điều này cho thấy sự hội tụ mạnh mẽ về sự khác biệt nhóm trong biến Y theo thời gian, tức là, qua các đoàn hệ).
Tôi nghĩ đó là một minh họa tốt về lý do tại sao tôi không tin vào mối tương quan giữa độ dốc, trên hết những gì Snijder & Bosker (1999) đã nói.
Chúng ta có nên thực sự tin tưởng và báo cáo mối tương quan giữa độ dốc trong các nghiên cứu đa cấp độ? Cụ thể, tính hữu ích của mối tương quan đó là gì?
EDIT 1: Tôi không nghĩ nó sẽ trả lời câu hỏi của tôi, nhưng tôi đã yêu cầu tôi cung cấp thêm thông tin. Xem dưới đây, nếu nó giúp.
Dữ liệu được lấy từ Khảo sát xã hội chung. Đối với cú pháp, tôi đã sử dụng Stata 12, vì vậy nó đọc:
xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml cov(un) var
wordsum
là điểm kiểm tra từ vựng (0-10),bw1
là biến dân tộc (đen = 0, trắng = 1),aged1-aged9
là các biến số của tuổi,bw1aged1-bw1aged9
là sự tương tác giữa dân tộc và tuổi tác,cohort21
là biến đoàn hệ của tôi (21 loại, được mã hóa từ 0 đến 20).
Đầu ra đọc:
. xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml
> cov(un) var
Performing EM optimization:
Performing gradient-based optimization:
Iteration 0: log restricted-likelihood = -46809.738
Iteration 1: log restricted-likelihood = -46809.673
Iteration 2: log restricted-likelihood = -46809.673
Computing standard errors:
Mixed-effects REML regression Number of obs = 22156
Group variable: cohort21 Number of groups = 21
Obs per group: min = 307
avg = 1055.0
max = 1728
Wald chi2(17) = 1563.31
Log restricted-likelihood = -46809.673 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
wordsum | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
bw1 | 1.295614 .1030182 12.58 0.000 1.093702 1.497526
aged1 | -.7546665 .139246 -5.42 0.000 -1.027584 -.4817494
aged2 | -.3792977 .1315739 -2.88 0.004 -.6371779 -.1214175
aged3 | -.1504477 .1286839 -1.17 0.242 -.4026635 .101768
aged4 | -.1160748 .1339034 -0.87 0.386 -.3785207 .1463711
aged6 | -.1653243 .1365332 -1.21 0.226 -.4329245 .102276
aged7 | -.2355365 .143577 -1.64 0.101 -.5169423 .0458693
aged8 | -.2810572 .1575993 -1.78 0.075 -.5899461 .0278318
aged9 | -.6922531 .1690787 -4.09 0.000 -1.023641 -.3608649
bw1aged1 | -.2634496 .1506558 -1.75 0.080 -.5587297 .0318304
bw1aged2 | -.1059969 .1427813 -0.74 0.458 -.3858431 .1738493
bw1aged3 | -.1189573 .1410978 -0.84 0.399 -.395504 .1575893
bw1aged4 | .058361 .1457749 0.40 0.689 -.2273525 .3440746
bw1aged6 | .1909798 .1484818 1.29 0.198 -.1000393 .4819988
bw1aged7 | .2117798 .154987 1.37 0.172 -.0919891 .5155486
bw1aged8 | .3350124 .167292 2.00 0.045 .0071262 .6628987
bw1aged9 | .7307429 .1758304 4.16 0.000 .3861217 1.075364
_cons | 5.208518 .1060306 49.12 0.000 5.000702 5.416334
------------------------------------------------------------------------------
------------------------------------------------------------------------------
Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval]
-----------------------------+------------------------------------------------
cohort21: Unstructured |
var(bw1) | .0049087 .010795 .0000659 .3655149
var(_cons) | .0480407 .0271812 .0158491 .145618
cov(bw1,_cons) | -.0119882 .015875 -.0431026 .0191262
-----------------------------+------------------------------------------------
var(Residual) | 3.988915 .0379483 3.915227 4.06399
------------------------------------------------------------------------------
LR test vs. linear regression: chi2(3) = 85.83 Prob > chi2 = 0.0000
Note: LR test is conservative and provided only for reference.
Scatterplot tôi sản xuất được hiển thị dưới đây. Có chín ô phân tán, một cho mỗi loại biến tuổi của tôi.
EDIT 2:
. estat recovariance
Random-effects covariance matrix for level cohort21
| bw1 _cons
-------------+----------------------
bw1 | .0049087
_cons | -.0119882 .0480407
Có một điều nữa tôi muốn nói thêm: Điều làm phiền tôi là, liên quan đến hiệp phương sai / tương quan độ dốc, Joop J. Hox (2010, trang 90) trong cuốn sách "Các kỹ thuật và ứng dụng phân tích đa cấp, Ấn bản thứ hai" nói rằng :
Sẽ dễ dàng hơn để giải thích hiệp phương sai này nếu nó được trình bày như là một mối tương quan giữa phần dư chặn và độ dốc. ... Trong một mô hình không có các yếu tố dự đoán khác ngoại trừ biến thời gian, mối tương quan này có thể được hiểu là một mối tương quan thông thường, nhưng trong mô hình 5 và 6, nó là một mối tương quan một phần, có điều kiện dựa trên các yếu tố dự đoán trong mô hình.
Vì vậy, dường như không phải ai cũng đồng ý với Snijder & Bosker (1999, trang 119), người tin rằng "ý tưởng về mối tương quan không có ý nghĩa ở đây" bởi vì nó không bị ràng buộc giữa [-1, 1].