[Điều sau đây có lẽ hơi kỹ thuật vì sử dụng các phương trình nhưng nó được xây dựng chủ yếu trên các biểu đồ mũi tên để cung cấp trực giác chỉ đòi hỏi sự hiểu biết rất cơ bản về OLS - vì vậy đừng bị từ chối.]
Giả sử bạn muốn ước tính tác động nhân quả của trên y i đưa ra bởi các hệ số ước tính cho β , nhưng đối với một số lý do có sự tương quan giữa biến giải thích của bạn và thời hạn báo lỗi:xiyiβ
ytôi= =α+βxtôi+↖c o r rεtôi↗
Điều này có thể đã xảy ra vì chúng tôi quên bao gồm một biến quan trọng cũng tương quan với . Vấn đề này được gọi là thiên vị biến bỏ qua và sau đó bạn β sẽ không cung cấp cho bạn các hiệu ứng nhân quả (xem ở đây để biết chi tiết). Đây là một trường hợp khi bạn muốn sử dụng một nhạc cụ vì chỉ khi đó bạn mới có thể tìm thấy hiệu ứng nhân quả thực sự.xtôiβˆ
Một công cụ là một biến mới không tương thích với ϵ i , nhưng nó tương quan tốt với x i và chỉ ảnh hưởng đến y i thông qua x i - vì vậy công cụ của chúng tôi được gọi là "ngoại sinh". Nó giống như trong biểu đồ này ở đây:ztôiεtôixtôiytôixtôi
ztôi→xtôi↑εtôi→↗ytôi
Vậy làm thế nào để chúng ta sử dụng biến mới này?
Có thể bạn nhớ ý tưởng loại ANOVA đằng sau hồi quy nơi bạn chia tổng biến thể của biến phụ thuộc thành một thành phần được giải thích và không giải thích được. Ví dụ: nếu bạn hồi quy trên thiết bị,xtôi
xtôitổng biến thể= a+πztôigiải thích biến thể+ ηtôibiến thể không giải thích được
sau đó bạn biết rằng biến thể được giải thích ở đây là ngoại sinh với phương trình ban đầu của chúng tôi bởi vì nó chỉ phụ thuộc vào biến ngoại sinh . Vì vậy, trong ý nghĩa này, chúng tôi chia chúng tôi x i lên thành một phần mà chúng ta có thể khẳng định chắc chắn là ngoại sinh (đó là phần mà phụ thuộc vào z i ) và một số phần không giải thích được η i mà giữ tất cả các biến thể xấu mà tương quan với εztôixtôiztôiηtôi . Bây giờ chúng ta lấy phần ngoại sinh của hồi quy này, gọi nó là ^ x i ,εtôixtôiˆ
xtôi= a+πztôibiến thể tốt= =xˆtôi+ ηtôibiến thể xấu
và đưa điều này vào hồi quy ban đầu của chúng tôi:
ytôi= Α + βxˆtôi+ εtôi
Bây giờ kể từ x i là không tương quan nữa với ε i (hãy nhớ, chúng ta "lọc ra" phần này từ x i và để nó trong η i ), chúng tôi liên tục có thể ước tính của chúng tôi β vì cụ đã giúp chúng tôi để phá vỡ mối tương quan giữa các giải thích thay đổi và lỗi. Đây là một cách bạn có thể áp dụng các biến công cụ. Phương pháp này thực sự được gọi là bình phương tối thiểu 2 giai đoạn, trong đó hồi quy của chúng tôi về x i trên z i được gọi là "giai đoạn đầu tiên" và phương trình cuối cùng ở đây được gọi là "giai đoạn thứ hai".xˆtôiεtôixtôiηtôiβxtôiztôi
Xét về hình ảnh gốc của chúng tôi (tôi bỏ qua để không làm cho một mớ hỗn độn nhưng hãy nhớ rằng nó là có!), Thay vì đi theo con đường thẳng, thiếu sót giữa x i để y i chúng tôi mất một bước trung gian thông qua xεtôixtôiytôixˆtôi
ztôi→xtôi↗→xˆtôi↓ytôi
Nhờ dẫn dòng nhỏ này của con đường của chúng tôi để tác động nhân quả chúng tôi có thể liên tục ước lượng bằng cách sử dụng công cụ. Chi phí của sự chuyển hướng này là các mô hình biến công cụ thường ít chính xác hơn, có nghĩa là chúng có xu hướng có lỗi tiêu chuẩn lớn hơn.β
Làm thế nào để chúng ta tìm thấy các công cụ?
Đó không phải là một câu hỏi dễ dàng bởi vì bạn cần phải thực hiện một trường hợp tốt là tại sao bạn sẽ không được tương quan với ε i - điều này không thể được kiểm tra chính thức vì các lỗi thật sự là không quan sát được. Do đó, thách thức chính là đưa ra một cái gì đó có thể được coi là ngoại sinh như thiên tai, thay đổi chính sách hoặc đôi khi bạn thậm chí có thể chạy thử nghiệm ngẫu nhiên. Các câu trả lời khác có một số ví dụ rất hay cho điều này vì vậy tôi sẽ không lặp lại phần này.ztôiεtôi