Giải thích các hệ số hồi quy dựa trên phương pháp mở rộng lại của Andrew Gelman


8

Tôi có hai yếu tố dự báo trong mô hình hồi quy logistic nhị phân: Một nhị phân và một liên tục. Mục tiêu chính của tôi là so sánh các hệ số của hai yếu tố dự đoán trong cùng một mô hình.

Tôi đã bắt gặp đề xuất của Andrew Gelman để chuẩn hóa các biến đầu vào hồi quy liên tục:

I) Đề xuất ban đầu (2008): chia dự đoán liên tục cho 2 SD

Original manuscript: 
http://www.stat.columbia.edu/~gelman/research/published/standardizing7.pdf

II) Khuyến nghị cập nhật (2009): chia dự đoán liên tục cho 1 SD VÀ mã lại các giá trị đầu vào nhị phân từ (0,1) đến (-1, + 1)).

Updated recommendation (1 SD, recode binary):
http://andrewgelman.com/2009/06/09/standardization/

Giải thích chính xác các hệ số kết quả vẫn còn khó nắm bắt đối với tôi:

SCENARIO 1: CẢ HAI NHÂN VIÊN ĐƯỢC TÍN HIỆU TRONG MÔ HÌNH CÙNG

Kết quả: nhị phân không biến đổi Y Công cụ dự báo liên tục: XCONT (chia cho 1sd) Công cụ dự đoán nhị phân: XBIN (được mã hóa lại để lấy các giá trị -1 hoặc 1)

  > orfit1c=with(data=mat0, glm(YBIN~XCONT+XBIN, 
   family=binomial(link="logit")))
  > summary(orfit1c)

   Call:
   glm(formula = YBIN ~XCONT + XBIN, family = binomial(link = "logit"))

   Deviance Residuals: 
           Min       1Q   Median       3Q      Max  
       -0.9842  -0.6001  -0.5481  -0.5481   1.9849  

       Coefficients:
                    Estimate Std. Error z value Pr(>|z|)    
        (Intercept)  -1.8197     0.1761 -10.331  < 2e-16 ***
        XCONT         0.3175     0.1190   2.667  0.00765 ** 
        XBIN          1.0845     0.3564   3.043  0.00234 ** 
        ---
       Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

       (Dispersion parameter for binomial family taken to be 1)

       Null deviance: 398.99  on 409  degrees of freedom
       Residual deviance: 385.88  on 407  degrees of freedom
       AIC: 391.88

SCENARIO 2: NEITHER TÍN HIỆU TRONG MÔ HÌNH CÙNG (NHƯNG khi chúng được nhập riêng trong hai mô hình khác nhau, các hệ số của chúng đều có ý nghĩa)

       Call:
      glm(formula =YBIN2 ~ XCONT2 + XBIN2, family = binomial(link = 
       "logit"))

               Deviance Residuals: 
           Min       1Q   Median       3Q      Max  
          -1.0090  -0.6265  -0.5795  -0.5795   1.9573  

            Coefficients:
                   Estimate Std. Error z value Pr(>|z|)    
       (Intercept)  -1.7562     0.1835  -9.570   <2e-16 ***
       XCONT2         0.2182     0.1318   1.656   0.0977 .  
       XBIN2        0.6063     0.3918   1.547   0.1218    
                         ---
       Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

          (Dispersion parameter for binomial family taken to be 1)

          Null deviance: 398.99  on 409  degrees of freedom
          Residual deviance: 390.01  on 407  degrees of freedom
          AIC: 396.01

Câu hỏi: Đối với phương pháp chia tỷ lệ ban đầu, người ta đã giải thích rằng "một thay đổi một đơn vị trong một công cụ dự báo liên tục bao gồm hai độ lệch chuẩn của công cụ dự đoán đó"

Đối với phương pháp chia tỷ lệ được cập nhật, tôi có đúng trong cách diễn giải kịch bản số 1 của mình không:

(1) thay đổi một đơn vị trong bộ dự báo liên tục bao gồm 1 độ lệch chuẩn của XCONT

(2) và thay đổi này trong 1 SD trong XCONT tương đương với thay đổi 1 đơn vị (nghĩa là vắng mặt hoặc hiện diện) của bộ dự đoán nhị phân (XBIN).

(3) theo đó, 1 thay đổi SD trong XBIN dự đoán mức tăng 1 đơn vị YBIN trong khi mức tăng 1/3 đơn vị trong YCONT dự đoán mức tăng 1 đơn vị trong YBIN?

CÂU HỎI

  • Có giải thích được nêu trong 1-3 cần bất kỳ sự điều chỉnh? Vì biến kết quả nhị phân không được mã hóa lại, tôi vẫn có thể nói rằng 1 đơn vị thay đổi trong X dự đoán thay đổi 1 đơn vị trong kết quả nhị phân (0 hoặc 1)?

  • Những gì khác có thể được nói về kết quả, cụ thể là khi tôi cố gắng so sánh hai hệ số cho các yếu tố dự đoán liên tục và nhị phân?

Câu trả lời:


-1

(1) có phần hơi lúng túng và tôi không chắc chính xác ý bạn là gì. Tôi sẽ giải thích ước tính tham số XCONT là:

Quan sát một độ lệch chuẩn trên giá trị trung bình của XCONT có YBIN ~ 32 phần trăm thường xuyên hơn.

Khi bạn diễn giải ước tính tham số XBIN, hãy nhớ rằng bạn đang diễn giải ở mức trung bình của XCONT.

Richard McElreath hoạt động thông qua một ví dụ về sự thay đổi kích thước này trong Xem xét lại thống kê.


2
Câu trả lời này không có ý nghĩa.
Michael R. Chernick

@MichaelCécick sẽ đánh giá cao suy nghĩ của bạn về câu hỏi ban đầu
ksroogl

Tôi không quen thuộc với lý do của Gelman. Tôi không hiểu tại sao anh ta thay đổi giá trị nhị phân 0 thành -1.
Michael R. Chernick

@MichaelCécick Tôi nghĩ rằng nó để các mức nhị phân được thay đổi
kích thước

Điều đó chắc chắn có thể làm việc. Tại sao đối xứng quanh 0 là một điều tốt để làm?.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.