Tôi được cho biết rằng có thể thực hiện hồi quy IV hai giai đoạn trong đó giai đoạn đầu tiên là một probit và giai đoạn thứ hai là một OLS. Có thể sử dụng 2SLS nếu giai đoạn đầu tiên là probit nhưng giai đoạn thứ hai là mô hình probit / poisson?
Tôi được cho biết rằng có thể thực hiện hồi quy IV hai giai đoạn trong đó giai đoạn đầu tiên là một probit và giai đoạn thứ hai là một OLS. Có thể sử dụng 2SLS nếu giai đoạn đầu tiên là probit nhưng giai đoạn thứ hai là mô hình probit / poisson?
Câu trả lời:
Những gì đã được đề xuất cho bạn đôi khi được gọi là hồi quy bị cấm và nói chung, bạn sẽ không nhất quán ước tính mối quan hệ lợi ích. Hồi quy bị cấm tạo ra các ước tính nhất quán chỉ theo các giả định rất hạn chế mà hiếm khi có trong thực tế (xem ví dụ Wooldridge (2010) "Phân tích kinh tế lượng của mặt cắt ngang một dữ liệu bảng", trang 265-268).
Vấn đề là cả toán tử kỳ vọng có điều kiện và phép chiếu tuyến tính đều mang các hàm phi tuyến. Vì lý do này, chỉ có hồi quy OLS trong giai đoạn đầu tiên được đảm bảo để tạo ra các giá trị phù hợp không tương thích với phần dư. Bằng chứng cho điều này có thể được tìm thấy trong "Phân tích kinh tế lượng" của Greene (2008) hoặc, nếu bạn muốn một bằng chứng chi tiết hơn (nhưng cũng kỹ thuật hơn), bạn có thể xem qua các ghi chú của Jean-Louis Arcand trên p. 47 đến 52.
Vì lý do tương tự như trong hồi quy bị cấm, quy trình hai bước dường như rõ ràng này bắt chước 2SLS với probit sẽ không tạo ra các ước tính phù hợp. Điều này một lần nữa bởi vì các kỳ vọng và các phép chiếu tuyến tính không thực hiện được thông qua các hàm phi tuyến. Wooldridge (2010) trong phần 15.7.3 trên trang 594 cung cấp giải thích chi tiết cho việc này. Ông cũng giải thích quy trình thích hợp để ước lượng các mô hình probit với một biến nội sinh nhị phân. Cách tiếp cận đúng là sử dụng khả năng tối đa nhưng làm điều này bằng tay không chính xác là tầm thường. Do đó, tốt hơn là bạn nên truy cập vào một số phần mềm thống kê có gói đóng hộp sẵn sàng cho việc này. Ví dụ, lệnh Stata sẽ là ivprobit
(xem hướng dẫn sử dụng Stata cho lệnh này cũng giải thích cách tiếp cận khả năng tối đa).
Nếu bạn yêu cầu tài liệu tham khảo cho lý thuyết đằng sau probit với các biến công cụ, hãy xem, ví dụ:
Cuối cùng, việc kết hợp các phương pháp ước tính khác nhau trong giai đoạn đầu tiên và thứ hai là khó khăn trừ khi tồn tại một nền tảng lý thuyết biện minh cho việc sử dụng chúng. Điều này không có nghĩa là nó không khả thi. Chẳng hạn, Adams và cộng sự. (2009) sử dụng quy trình ba bước trong đó họ có "giai đoạn đầu tiên" và giai đoạn thứ hai OLS mà không rơi vào vấn đề hồi quy bị cấm. Cách tiếp cận chung của họ là:
Một thủ tục tương tự đã được sử dụng bởi một người dùng trên Statalist, người muốn sử dụng Tobit giai đoạn đầu tiên và giai đoạn thứ hai Poisson (xem tại đây ). Việc sửa chữa tương tự sẽ khả thi cho vấn đề ước tính của bạn.
nếu bạn muốn một bằng chứng chi tiết hơn (nhưng cũng kỹ thuật hơn), bạn có thể xem qua các ghi chú của Jean-Louis Arcand trên p. 47 đến 52.
Điều này dường như không phải là trường hợp. Các cuộc thảo luận Arcand không phải là về hình thức chức năng; thay vào đó, đó là về sự bao gồm các bộ đồng biến khác nhau trong giai đoạn đầu tiên so với các mô hình giai đoạn thứ hai. "Nói cách khác, quy trình 2SLS chính xác đòi hỏi bao gồm tất cả các đồng biến ngoại sinh xuất hiện trong phương trình cấu trúc ở dạng rút gọn giai đoạn đầu. Hồi quy bị cấm liên quan đến việc loại bỏ một số hoặc tất cả chúng."
Quay trở lại câu hỏi ban đầu, tôi khuyên bạn nên sử dụng OLS cho giai đoạn đầu tiên và probit cho giai đoạn thứ hai. Mặc dù điều này có thể sai lệch về mặt kỹ thuật, có khả năng (giả sử bạn có một công cụ tốt) sẽ ít sai lệch hơn so với phương pháp không IV.