Giải thích các hệ số tương tác giữa biến phân loại và biến liên tục


9

Tôi có một câu hỏi về việc giải thích các hệ số của sự tương tác giữa biến liên tục và biến phân loại. đây là mô hình của tôi:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

giả sử phương trình của mô hình là:

E [cog] = a + b1 (lg_hag) + b2 (giáo dục2 * lg_hag) + b3 (giáo dục3 * lg_hag) + b4 (giáo dục4 * lg_hag) + b5 (pdg, chính giữa)

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

Câu hỏi của tôi là: nếu cách giải thích của tôi là đúng, làm thế nào để xây dựng các khoảng tin cậy cho từng ước tính hiệu ứng của các tương tác (ví dụ: b1 + b2) từ các khoảng tin cậy của b1 và b2.


không quen thuộc với cách làm điều đó trong R. giả sử trong sas bạn có thể nhận được kết quả bằng câu lệnh "ước tính", tham khảo support.sas.com/documentation/cdl/en/statug/63033/HTML/default/
tựa

Câu trả lời:


7

Giải thích của bạn về các hệ số của mô hình là không hoàn toàn chính xác. Trước tiên hãy để tôi tóm tắt các điều khoản của mô hình.

Các biến thể loại (yếu tố): , s e xe d u c aracesexeduca

Hệ số racecó bốn cấp độ: .race={white,black,mexican,multi/other}

Hệ số sexcó hai cấp độ: .sex={male,female}

Hệ số educacó năm cấp độ: .educa={1,2,3,4,5}

Theo mặc định, R sử dụng độ tương phản điều trị cho các biến phân loại. Trong các tương phản này, giá trị đầu tiên của yếu tố được sử dụng ở mức tham chiếu và các giá trị còn lại được kiểm tra so với tham chiếu. Số lượng tương phản tối đa cho một biến phân loại bằng với số cấp trừ đi một cấp.

Sự tương phản cho racephép kiểm tra các khác biệt sau: , r a c e = m e x i c a n v s . r a c e = w h i t er a c erace=black vs.race=whiterace=mexican vs.race=white .race=multi/other vs.race=white

Đối với hệ số , mức tham chiếu là 1 , mô hình tương phản là tương tự nhau. Những hiệu ứng này có thể được hiểu là sự khác biệt trong biến phụ thuộc. Trong ví dụ của bạn, giá trị trung bình là 13,8266 đơn vị cao hơn cho e d u c a = 2 so với e d u c a = 1 ( ).educa1cog13.8266educa=2educa=1as.factor(educa)2

Một lưu ý quan trọng: Nếu điều trị tương phản với một biến phân loại có trong một mô hình, thì việc ước tính các hiệu ứng tiếp theo dựa trên mức tham chiếu của biến phân loại nếu có cả tương tác giữa các hiệu ứng tiếp theo và biến phân loại. Nếu biến không phải là một phần của tương tác, thì hệ số của nó tương ứng với mức trung bình của các sườn con của các tập con của biến này cùng với tất cả các biến phân loại còn lại. Các tác động của e d u c a tương ứng với các hiệu ứng trung bình đối với các mức yếu tố của các biến khác. Để kiểm tra hiệu ứng tổng thể của r a c e , bạn cần phải rời khỏiraceeducarace s e x ra khỏi mô hình.educasex

Biến số: p d glg_hagpdg

Cả hai lg_hagpdglà các biến số do đó các hệ số biểu thị sự thay đổi của biến phụ thuộc liên quan đến mức tăng trong yếu tố dự đoán.1

pdglg_hageducaeduca=1lg_hag

lg_hag×educa

lg_hageducalg_hageducaeduca=1

lg_hag:as.factor(educa)2-21.2224lg_hag21.2224educa=2educa=1


"Các hệ số tương tác này cũng giữ race=whitesex=malechỉ." bạn có chắc chắn về điều này? Tôi hỏi bởi vì cả hai racecũng không sextương tác với lg_hag×educathuật ngữ này ... Tôi đang xem một số văn bản tôi không thấy điều này được chỉ định rõ ràng.
Landroni

2
@landroni Độ dốc được ước tính cho điểm mà tất cả các yếu tố dự đoán còn lại đều bằng 0.
Sven Hohenstein

Vâng, đó là sự hiểu biết của tôi về nó quá. Tất cả các yếu tố dự đoán khác được giữ cố định, có nghĩa là các yếu tố được cố định ở mức cơ sở. Nhưng trong đó có câu hỏi hóc búa của tôi: Tôi đã xem một vài cuốn sách dường như chủ yếu nói về sắc thái tinh tế nhưng sâu rộng này. Hơn nữa, các bài báo thường "kiểm soát theo ngành" chưa đưa ra kết luận như thể các hệ số là vô điều kiện so với mẫu đầy đủ, thay vì chỉ ra rằng điều này chỉ dành cho cấp cơ sở .. Xem thêm: stats.stackexchange.com/questions/146665/ ...
landroni

1
"Nếu điều trị tương phản với một biến phân loại có mặt trong một mô hình, việc ước tính các tác động tiếp theo được dựa trên mức tham chiếu của biến phân loại." Sau khi xem xét thêm, tôi không bị thuyết phục (hoặc tôi hoàn toàn không tuân theo lập luận của bạn). Bạn dường như ngụ ý rằng ước tính beta cho ví dụ pdgphụ thuộc vào mức độ tham chiếu, rõ ràng không phải là trường hợp. Nếu tôi thay đổi mức tham chiếu của bất kỳ yếu tố nào (ví dụ sex), ước tính pdgsẽ KHÔNG thay đổi ...
Landroni

1
@landroni Cảm ơn bạn đã chỉ ra. Bạn nói đúng, tuyên bố này là sai lệch. Trên thực tế, nó chỉ giữ cho các yếu tố dự đoán cũng là một phần của thuật ngữ tương tác với các biến phân loại. Do đó, ước tính pdgthực sự không phụ thuộc vào đặc điểm kỹ thuật của sự tương phản. Tôi sẽ sửa đổi câu trả lời cho phù hợp.
Sven Hohenstein
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.