Tôi có hai yếu tố dự báo trong mô hình hồi quy logistic nhị phân: Một nhị phân và một liên tục. Mục tiêu chính của tôi là so sánh các hệ số của hai yếu tố dự đoán trong cùng một mô hình.
Tôi đã bắt gặp đề xuất của Andrew Gelman để chuẩn hóa các biến đầu vào hồi quy liên tục:
I) Đề xuất ban đầu (2008): chia dự đoán liên tục cho 2 SD
Original manuscript:
http://www.stat.columbia.edu/~gelman/research/published/standardizing7.pdf
II) Khuyến nghị cập nhật (2009): chia dự đoán liên tục cho 1 SD VÀ mã lại các giá trị đầu vào nhị phân từ (0,1) đến (-1, + 1)).
Updated recommendation (1 SD, recode binary):
http://andrewgelman.com/2009/06/09/standardization/
Giải thích chính xác các hệ số kết quả vẫn còn khó nắm bắt đối với tôi:
SCENARIO 1: CẢ HAI NHÂN VIÊN ĐƯỢC TÍN HIỆU TRONG MÔ HÌNH CÙNG
Kết quả: nhị phân không biến đổi Y Công cụ dự báo liên tục: XCONT (chia cho 1sd) Công cụ dự đoán nhị phân: XBIN (được mã hóa lại để lấy các giá trị -1 hoặc 1)
> orfit1c=with(data=mat0, glm(YBIN~XCONT+XBIN,
family=binomial(link="logit")))
> summary(orfit1c)
Call:
glm(formula = YBIN ~XCONT + XBIN, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-0.9842 -0.6001 -0.5481 -0.5481 1.9849
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.8197 0.1761 -10.331 < 2e-16 ***
XCONT 0.3175 0.1190 2.667 0.00765 **
XBIN 1.0845 0.3564 3.043 0.00234 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 398.99 on 409 degrees of freedom
Residual deviance: 385.88 on 407 degrees of freedom
AIC: 391.88
SCENARIO 2: NEITHER TÍN HIỆU TRONG MÔ HÌNH CÙNG (NHƯNG khi chúng được nhập riêng trong hai mô hình khác nhau, các hệ số của chúng đều có ý nghĩa)
Call:
glm(formula =YBIN2 ~ XCONT2 + XBIN2, family = binomial(link =
"logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.0090 -0.6265 -0.5795 -0.5795 1.9573
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.7562 0.1835 -9.570 <2e-16 ***
XCONT2 0.2182 0.1318 1.656 0.0977 .
XBIN2 0.6063 0.3918 1.547 0.1218
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 398.99 on 409 degrees of freedom
Residual deviance: 390.01 on 407 degrees of freedom
AIC: 396.01
Câu hỏi: Đối với phương pháp chia tỷ lệ ban đầu, người ta đã giải thích rằng "một thay đổi một đơn vị trong một công cụ dự báo liên tục bao gồm hai độ lệch chuẩn của công cụ dự đoán đó"
Đối với phương pháp chia tỷ lệ được cập nhật, tôi có đúng trong cách diễn giải kịch bản số 1 của mình không:
(1) thay đổi một đơn vị trong bộ dự báo liên tục bao gồm 1 độ lệch chuẩn của XCONT
(2) và thay đổi này trong 1 SD trong XCONT tương đương với thay đổi 1 đơn vị (nghĩa là vắng mặt hoặc hiện diện) của bộ dự đoán nhị phân (XBIN).
(3) theo đó, 1 thay đổi SD trong XBIN dự đoán mức tăng 1 đơn vị YBIN trong khi mức tăng 1/3 đơn vị trong YCONT dự đoán mức tăng 1 đơn vị trong YBIN?
CÂU HỎI
Có giải thích được nêu trong 1-3 cần bất kỳ sự điều chỉnh? Vì biến kết quả nhị phân không được mã hóa lại, tôi vẫn có thể nói rằng 1 đơn vị thay đổi trong X dự đoán thay đổi 1 đơn vị trong kết quả nhị phân (0 hoặc 1)?
Những gì khác có thể được nói về kết quả, cụ thể là khi tôi cố gắng so sánh hai hệ số cho các yếu tố dự đoán liên tục và nhị phân?