Làm thế nào để tôi giải thích một mô hình probit trong Stata?


13

Tôi không chắc làm thế nào để diễn giải hồi quy probit này mà tôi đã chạy trên Stata. Dữ liệu được phê duyệt cho vay và màu trắng là một biến giả có = 1 nếu một người da trắng và = 0 nếu người đó không. Bất kỳ trợ giúp về cách đọc này sẽ được đánh giá rất cao. Điều tôi chủ yếu tìm kiếm là làm thế nào để tìm xác suất ước tính cho vay đối với cả người da trắng và người không phải là người da trắng. Ai đó cũng có thể giúp tôi với văn bản trên đây và làm thế nào để làm cho nó bình thường ?? Tôi xin lỗi tôi không biết làm thế nào để làm điều này.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

cho biến trắng:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

cho hằng số:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  

Câu trả lời:


44

Nói chung, bạn không thể giải thích các hệ số từ đầu ra của hồi quy probit (ít nhất là theo bất kỳ cách tiêu chuẩn nào). Bạn cần diễn giải các tác động biên của các biến hồi quy, nghĩa là xác suất (có điều kiện) của biến kết quả thay đổi bao nhiêu khi bạn thay đổi giá trị của một biến hồi quy, giữ tất cả các biến hồi quy khác ở một số giá trị. Điều này khác với trường hợp hồi quy tuyến tính nơi bạn đang diễn giải trực tiếp các hệ số ước tính. Điều này là như vậy bởi vì trong trường hợp hồi quy tuyến tính, các hệ số hồi quy là các hiệu ứng cận biên .

Trong hồi quy probit, có thêm một bước tính toán cần thiết để có được các hiệu ứng cận biên sau khi bạn đã tính toán hồi quy probit phù hợp.

Mô hình hồi quy tuyến tính và probit

  • Hồi quy probit: Hãy nhớ lại rằng trong mô hình probit, bạn đang mô hình hóa xác suất (có điều kiện) của kết quả "thành công", nghĩa là, , trong đó là chức năng phân phối tích lũy của phân phối chuẩn thông thường. Về cơ bản điều này nói rằng, có điều kiện trên các biến hồi quy, xác suất biến kết quả, là 1, là một hàm nhất định của sự kết hợp tuyến tính của các biến hồi quy.P [ Y i = 1 | X 1 i , ... , X K i ; β 0 , ... , β K ] = Φ ( β 0 + K Σ k = 1 β k X k i ) Φ ( ) Y iYTôi= =1

    P[YTôi= =1|X1Tôi,Giáo dục,XKTôi;β0,Giáo dục,βK]= =Φ(β0+Σk= =1KβkXkTôi)
    Φ()YTôi
  • Hồi quy tuyến tính : So sánh điều này với mô hình hồi quy tuyến tính, trong đó

E(YTôi|X1Tôi,Giáo dục,XKTôi;β0,Giáo dục,βK)= =β0+Σk= =1KβkXkTôi
trung bình (có điều kiện) của kết quả là sự kết hợp tuyến tính của các biến hồi quy.

Hiệu ứng cận biên

Khác với mô hình hồi quy tuyến tính, các hệ số hiếm khi có bất kỳ giải thích trực tiếp nào. Chúng tôi thường quan tâm đến các hiệu ứng paribus ceteris của những thay đổi trong các biến hồi quy ảnh hưởng đến các tính năng của biến kết quả. Đây là khái niệm mà hiệu ứng cận biên đo lường.

  • Hồi quy tuyến tính : Bây giờ tôi muốn biết giá trị trung bình của biến kết quả di chuyển bao nhiêu khi tôi di chuyển một trong các biến hồi quy

E(YTôi|X1Tôi,Giáo dục,XKTôi;β0,Giáo dục,βK)XkTôi= =βk

Nhưng đây chỉ là hệ số hồi quy, có nghĩa là hiệu ứng cận biên của một thay đổi trong hồi quy thứ chỉ là hệ số hồi quy.k

  • Hồi quy probit: Tuy nhiên, dễ dàng nhận thấy rằng đây không phải là trường hợp của hồi quy probit

P[YTôi= =1|X1Tôi,Giáo dục,XKTôi;β0,Giáo dục,βK]XkTôi= =βkφ(β0+Σk= =1KβkXkTôi)
đó là không giống như các hệ số hồi quy. Đây là những hiệu ứng cận biên cho mô hình probit và số lượng chúng ta đang theo đuổi. Cụ thể, điều này phụ thuộc vào giá trị của tất cả các biến hồi quy khác và hệ số hồi quy. Ở đây là hàm mật độ xác suất chuẩn thông thường.φ()

Làm thế nào để bạn tính toán số lượng này, và các lựa chọn của các biến hồi quy khác nên nhập công thức này là gì? Rất may, Stata cung cấp tính toán này sau hồi quy probit và cung cấp một số giá trị mặc định cho các lựa chọn của các biến hồi quy khác (không có thỏa thuận chung về các mặc định này).

Hồi quy rời rạc

Lưu ý rằng phần lớn những điều trên áp dụng cho trường hợp hồi quy liên tục, vì chúng ta đã sử dụng phép tính. Trong trường hợp các hồi quy rời rạc, bạn cần sử dụng các thay đổi riêng biệt. Ví dụ, SO, thay đổi rời rạc trong một biến hồi quy lấy các giá trị làXkTôi{0,1}

ΔXkTôiP[YTôi= =1|X1Tôi,Giáo dục,XKTôi;β0,Giáo dục,βK]= =βkφ(β0+Σtôi= =1k-1βtôiXtôiTôi+βk+Σtôi= =k+1KβtôiXtôiTôi)-βkφ(β0+Σtôi= =1k-1βtôiXtôiTôi+Σtôi= =k+1KβtôiXtôiTôi)

Tính toán hiệu ứng cận biên trong Stata

Hồi quy probit: Dưới đây là một ví dụ về tính toán các hiệu ứng cận biên sau một hồi quy probit trong Stata.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

Đây là đầu ra bạn sẽ nhận được từ marginslệnh

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

Điều này có thể được giải thích, ví dụ, một đơn vị thay đổi trong agebiến, làm tăng xác suất của trạng thái hợp nhất thêm 0,003442. Tương tự như vậy, là từ phía nam, làm giảm xác suất của tình trạng liên minh xuống 0.1054928

Hồi quy tuyến tính : Như một kiểm tra cuối cùng, chúng ta có thể xác nhận rằng các hiệu ứng cận biên trong mô hình hồi quy tuyến tính giống như các hệ số hồi quy (với một vòng xoắn nhỏ). Chạy hồi quy sau và tính toán các hiệu ứng cận biên sau

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

chỉ cung cấp cho bạn các hệ số hồi quy. Lưu ý một thực tế thú vị mà Stata tính toán lưới hiệu quả biên của một regressor bao gồm cả các hiệu ứng thông qua các điều khoản bậc hai nếu đưa vào mô hình.

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------

Tôi nghĩ rằng biểu thức của bạn cho cho trường hợp hồi quy rời rạc là sai. Bạn đang lấy sự khác biệt của đạo hàm của , nhưng nó phải là sự khác biệt của . Nó chỉ nên là thuật ngữ thứ hai của RHS, nhưng không có dấu hiệu tiêu cực. ΔXkP[Y= =1]P[Y= =1]
Ravi

1

Ngoài ra, và đơn giản hơn, hệ số trong hồi quy probit có thể được hiểu là "mức tăng một đơn vị tuổi tương ứng với mức tăng trong chỉ số z cho xác suất kết hợp" ( xem liên kết ).βmộtge

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

Sau đó làm

predict yhat

Và bạn sẽ thấy rằng đối với obs 1, giá trị được trang bị tương đương với . Cắm nó vào funciton để trả về xác suất tương ứng:βmộtge*20+βgrmộtde*12+βconSnormal()

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

Do đó, tuổi tăng một đơn vị tương ứng với mức tăng trong chỉ số z của xác suất tham gia liên minh.βmộtge

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.