Trường hợp của bạn là ít vấn đề hơn so với cách khác. Các toán tử dự đoán và phép chiếu tuyến tính trải qua giai đoạn đầu tiên tuyến tính (ví dụ OLS) nhưng không thông qua các toán tử phi tuyến tính như probit hoặc logit. Vì vậy nó không phải là một vấn đề nếu bạn lần đầu tiên thoái liên tục nội sinh biến của bạn trên công cụ của bạn (s) Z ,
X i = một + Z ' i pi + η i
và sau đó sử dụng các giá trị được trang bị trong một probit giai đoạn thứ hai để ước tính
Pr ( Y i = 1 | X i ) = Pr ( X iXZ
XTôi= a + Z'Tôiπ+ ηTôi
Pr ( YTôi= 1 | XˆTôi) = Pr ( βXˆTôi+ εTôi> 0 )
XˆTôi
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
Trong ví dụ này, chúng tôi muốn ước tính ảnh hưởng của số năm giáo dục đến xác suất tham gia vào một liên minh lao động. Cho rằng những năm giáo dục có khả năng là nội sinh, chúng tôi sử dụng nó với nhiều năm trong giai đoạn đầu tiên. Tất nhiên, điều này không có ý nghĩa gì từ quan điểm giải thích nhưng nó minh họa mã.
Chỉ cần đảm bảo rằng bạn sử dụng các biến kiểm soát ngoại sinh giống nhau trong cả giai đoạn đầu tiên và thứ hai. Trong ví dụ trên, đó là những age, race
dụng cụ (không nhạy cảm) tenure
chỉ có ở giai đoạn đầu tiên.