Tính nhất quán của 2SLS với biến nội sinh nhị phân


10

Tôi đã đọc rằng công cụ ước tính 2SLS vẫn nhất quán ngay cả với biến nội sinh nhị phân ( http://www.stata.com/stirthist/archive/2004-07/msg00699.html ). Trong giai đoạn đầu tiên, một mô hình xử lý probit sẽ được chạy thay vì mô hình tuyến tính.

Có bằng chứng chính thức nào cho thấy 2SLS vẫn nhất quán ngay cả khi giai đoạn 1 là mô hình probit hoặc logit không?

Ngoài ra nếu kết quả cũng là nhị phân thì sao? Tôi hiểu nếu chúng ta có kết quả nhị phân và biến nội sinh nhị phân (giai đoạn 1 và 2 là cả hai mô hình probit / logit nhị phân), bắt chước phương pháp 2SLS sẽ tạo ra ước tính không nhất quán. Có bằng chứng chính thức nào cho việc này không? Cuốn sách kinh tế lượng của Wooldridge có một số thảo luận nhưng tôi nghĩ không có bằng chứng nghiêm ngặt nào cho thấy sự không nhất quán.

data sim;
     do i=1 to 500000;
        iv=rand("normal",0,1);
             x2=rand("normal",0,1);
        x3=rand("normal",0,1);
        lp=0.5+0.8*iv+0.5*x2-0.2*x3;
        T=rand("bernoulli",exp(lp)/(1+exp(lp)));
        Y=-0.8+1.2*T-1.3*x2-0.8*x3+rand("normal",0,1);
        output;
     end;
     run;

****1st stage: logit model ****;
****get predicted values   ****;         
proc logistic data=sim descending;
     model T=IV;
     output out=pred1 pred=p;
     run;

****2nd stage: ols model with predicted values****;
proc reg data=pred1;
     model y=p;
     run;

hệ số của p = 1.19984. Tôi chỉ chạy một mô phỏng nhưng với kích thước mẫu lớn.


Bạn không cần thêm link = probit vào câu lệnh mô hình?
Mike Hunter

Câu trả lời:


10

Đã có một câu hỏi tương tự liên quan đến giai đoạn đầu tiên probit và giai đoạn thứ hai OLS. Trong câu trả lời, tôi đã cung cấp một liên kết đến các ghi chú có chứa bằng chứng chính thức về sự không nhất quán của hồi quy này, chính thức được gọi là "hồi quy bị cấm", vì nó được gọi là Jerry Hausman. Lý do chính cho sự không nhất quán của phương pháp giai đoạn thứ nhất probit / OLS là vì cả toán tử kỳ vọng lẫn toán tử phép chiếu tuyến tính đều đi qua giai đoạn đầu tiên phi tuyến tính. Do đó, các giá trị được trang bị từ một probit giai đoạn đầu tiên chỉ không tương thích với thuật ngữ lỗi giai đoạn thứ hai theo các giả định rất hạn chế mà hầu như không bao giờ có trong thực tế. Mặc dù vậy, hãy lưu ý rằng bằng chứng chính thức về sự không nhất quán của hồi quy bị cấm là khá phức tạp, nếu tôi nhớ chính xác.

YTôi= =α+βXTôi+εTôi
YTôiXTôi
XTôi= =một+ZTôi'π+ηTôi
X^TôiXTôiXTôi


YTôi

Để thảo luận chi tiết hơn về điều này, hãy xem các ghi chú bài giảng tuyệt vời của Kit Baum về chủ đề này. Từ slide 7, ông thảo luận về việc sử dụng mô hình xác suất tuyến tính trong bối cảnh 2SLS.

Cuối cùng, nếu bạn thực sự muốn sử dụng probit vì bạn muốn ước tính hiệu quả hơn thì có một cách khác cũng được đề cập trong Wooldridge (2010) "Phân tích kinh tế lượng của dữ liệu mặt cắt và bảng điều khiển". Câu trả lời được liên kết ở trên bao gồm nó, tôi nhắc lại ở đây cho đầy đủ. Như một ví dụ áp dụng, xem Adams et al. (2009) , người sử dụng quy trình ba bước như sau:

  1. sử dụng probit để hồi quy biến nội sinh trên (các) dụng cụ và biến ngoại sinh
  2. sử dụng các giá trị dự đoán từ bước trước trong giai đoạn đầu OLS cùng với các biến ngoại sinh (nhưng không có công cụ)
  3. làm giai đoạn thứ hai như bình thường

Quy trình này không thuộc về vấn đề hồi quy bị cấm nhưng có khả năng cung cấp các ước tính hiệu quả hơn về tham số quan tâm của bạn.


Xin chào Andy, cảm ơn bạn đã trả lời. Bạn có gợi ý "sự không nhất quán của giai đoạn đầu tiên / phương pháp tiếp cận giai đoạn thứ hai của OLS" không? Đó không phải là những gì tôi đọc trong liên kết tôi đã đưa ra. Probit giai đoạn đầu / OLS cách tiếp cận giai đoạn thứ hai được cho là phù hợp.
Vincent

Đó không phải là những gì bài viết của Statalist nói. Nếu bạn xem phần "phương thức và công thức" cho lệnh Treatreg (hiện được gọi là etregress) trong tài liệu, bạn sẽ thấy rằng công cụ ước tính 2 bước không phải là 2SLS với giai đoạn thứ nhất probit / OLS. Thay vào đó, probit trước tiên được sử dụng để có được các tỷ lệ nguy hiểm sau đó được sử dụng trong hồi quy OLS để có được ước tính phù hợp.
Andy

Cảm ơn, Andy. Nó đang trở nên thú vị. Có vẻ như bắt chước 2SLS với mô hình probit trong giai đoạn 1 không được chấp nhận. Tôi sẽ đọc qua "cấm hồi quy" vì lý do trị liệu. Nhân tiện, tôi đã thử mô phỏng bằng cách sử dụng SAS và kết quả trông không tệ cho 2SLS với probit 1st / ols 2nd.
Vincent

Tôi đang đăng mã trong câu hỏi chính và rất thích nghe ý kiến ​​của bạn. Cảm ơn!
Vincent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.