Một biến công cụ là gì?


36

Các biến công cụ đang ngày càng trở nên phổ biến trong kinh tế học và thống kê ứng dụng. Đối với người không quen biết, chúng tôi có thể có một số câu trả lời phi kỹ thuật cho các câu hỏi sau:

  1. Một biến công cụ là gì?
  2. Khi nào người ta muốn sử dụng một biến công cụ?
  3. Làm thế nào để tìm hoặc chọn một biến công cụ?

4
Bạn không nghĩ rằng bài viết Wikipedia về nó là đủ?

1
Các câu hỏi như thế này đòi hỏi một loại phản hồi wiki / blog. Tôi nghĩ rằng câu hỏi không nên yêu cầu câu trả lời dài như vậy.

Tôi không chắc chắn điều đúng đắn là chỉ cần bỏ qua câu hỏi này và giới thiệu người hỏi đến wiki - đặc biệt là trong giai đoạn beta, nơi chúng tôi đang cố gắng xây dựng nội dung của trang web. Có lẽ người hỏi câu hỏi nên gửi từng câu hỏi riêng lẻ để chúng có thể được giải quyết tốt hơn.
russellpierce

3
@mbq - ví dụ wikipedia hầu như không đủ điều kiện là phi kỹ thuật. Nó rất phụ thuộc vào biệt ngữ và phương trình.
rolando2

1
Nó đã trở nên phổ biến trong kinh tế một thời gian trong những năm 1980. Một số nhà sinh học cũng đã nghe nói về nó và áp dụng nó trong bối cảnh các mô hình lỗi đo lường, trong đó các công cụ được coi là các phép đo bổ sung có sẵn. Chúng đủ điều kiện là công cụ trong bối cảnh kinh tế lượng rộng hơn: chúng có tương quan với biến quan tâm và chúng không tương thích với lỗi đo lường của nó.
StasK

Câu trả lời:


41

[Điều sau đây có lẽ hơi kỹ thuật vì sử dụng các phương trình nhưng nó được xây dựng chủ yếu trên các biểu đồ mũi tên để cung cấp trực giác chỉ đòi hỏi sự hiểu biết rất cơ bản về OLS - vì vậy đừng bị từ chối.]

Giả sử bạn muốn ước tính tác động nhân quả của trên y i đưa ra bởi các hệ số ước tính cho β , nhưng đối với một số lý do có sự tương quan giữa biến giải thích của bạn và thời hạn báo lỗi:xiyiβ

ytôi= =α+βxtôi+εtôicorr

Điều này có thể đã xảy ra vì chúng tôi quên bao gồm một biến quan trọng cũng tương quan với . Vấn đề này được gọi là thiên vị biến bỏ qua và sau đó bạn β sẽ không cung cấp cho bạn các hiệu ứng nhân quả (xem ở đây để biết chi tiết). Đây là một trường hợp khi bạn muốn sử dụng một nhạc cụ vì chỉ khi đó bạn mới có thể tìm thấy hiệu ứng nhân quả thực sự.xtôiβ^

Một công cụ là một biến mới không tương thích với ϵ i , nhưng nó tương quan tốt với x i và chỉ ảnh hưởng đến y i thông qua x i - vì vậy công cụ của chúng tôi được gọi là "ngoại sinh". Nó giống như trong biểu đồ này ở đây:ztôiεtôixtôiytôixtôi

ztôixtôiytôiεtôi

Vậy làm thế nào để chúng ta sử dụng biến mới này?
Có thể bạn nhớ ý tưởng loại ANOVA đằng sau hồi quy nơi bạn chia tổng biến thể của biến phụ thuộc thành một thành phần được giải thích và không giải thích được. Ví dụ: nếu bạn hồi quy trên thiết bị,xtôi

xtôitổng biến thể= =một+πztôigiải thích biến thể+ηtôibiến thể không giải thích được

sau đó bạn biết rằng biến thể được giải thích ở đây là ngoại sinh với phương trình ban đầu của chúng tôi bởi vì nó chỉ phụ thuộc vào biến ngoại sinh . Vì vậy, trong ý nghĩa này, chúng tôi chia chúng tôi x i lên thành một phần mà chúng ta có thể khẳng định chắc chắn là ngoại sinh (đó là phần mà phụ thuộc vào z i ) và một số phần không giải thích được η i mà giữ tất cả các biến thể xấu mà tương quan với εztôixtôiztôiηtôi . Bây giờ chúng ta lấy phần ngoại sinh của hồi quy này, gọi nó là ^ x i ,εtôixtôi^

xtôi= =một+πztôibiến thể tốt= =x^tôi+ηtôibiến thể xấu

và đưa điều này vào hồi quy ban đầu của chúng tôi:

ytôi= =α+βx^tôi+εtôi

Bây giờ kể từ x i là không tương quan nữa với ε i (hãy nhớ, chúng ta "lọc ra" phần này từ x i và để nó trong η i ), chúng tôi liên tục có thể ước tính của chúng tôi β vì cụ đã giúp chúng tôi để phá vỡ mối tương quan giữa các giải thích thay đổi và lỗi. Đây là một cách bạn có thể áp dụng các biến công cụ. Phương pháp này thực sự được gọi là bình phương tối thiểu 2 giai đoạn, trong đó hồi quy của chúng tôi về x i trên z i được gọi là "giai đoạn đầu tiên" và phương trình cuối cùng ở đây được gọi là "giai đoạn thứ hai".x^tôiεtôixtôiηtôiβxtôiztôi

Xét về hình ảnh gốc của chúng tôi (tôi bỏ qua để không làm cho một mớ hỗn độn nhưng hãy nhớ rằng nó là có!), Thay vì đi theo con đường thẳng, thiếu sót giữa x i để y i chúng tôi mất một bước trung gian thông qua xεtôixtôiytôix^tôi

x^tôiztôixtôiytôi

Nhờ dẫn dòng nhỏ này của con đường của chúng tôi để tác động nhân quả chúng tôi có thể liên tục ước lượng bằng cách sử dụng công cụ. Chi phí của sự chuyển hướng này là các mô hình biến công cụ thường ít chính xác hơn, có nghĩa là chúng có xu hướng có lỗi tiêu chuẩn lớn hơn.β

Làm thế nào để chúng ta tìm thấy các công cụ?
Đó không phải là một câu hỏi dễ dàng bởi vì bạn cần phải thực hiện một trường hợp tốt là tại sao bạn sẽ không được tương quan với ε i - điều này không thể được kiểm tra chính thức vì các lỗi thật sự là không quan sát được. Do đó, thách thức chính là đưa ra một cái gì đó có thể được coi là ngoại sinh như thiên tai, thay đổi chính sách hoặc đôi khi bạn thậm chí có thể chạy thử nghiệm ngẫu nhiên. Các câu trả lời khác có một số ví dụ rất hay cho điều này vì vậy tôi sẽ không lặp lại phần này.ztôiεtôi


10
+1 Cuối cùng tôi cũng biết ơn khi đọc câu trả lời chi tiết thay vì danh sách các tài liệu tham khảo hoặc liên kết.
whuber

1
Xuất sắc! Tôi giải thích này để sinh viên của tôi nhiều hơn "mnemonically" như: đang đầu độc / nhiễm độc bởi các yếu tố không quan sát được trong ε . Hồi quy giai đoạn đầu "làm sạch" / hút nọc độc từ x . Chúng ta có thể sử dụng "làm sạch" phiên bản của x để tìm ra hệ số nhân quả, β . xεxxβ
MichaelChirico

Có một đối số trực quan tại sao ước tính 2SLS cho là nhất quán không? Khi chúng tôi tính toán x i , chúng tôi được "lọc ra" một phần của x i đó là tương quan với lỗi này, nhưng tại sao nó phải được rằng lọc ra không thay đổi x i trong một cách mà thay đổi ước tính của chúng tôi cho β ? βx^tôixtôixtôiβ
dùng35734

Xem tại đây: stats.stackexchange.com/questions/64279/ Hãy hoặc bạn có thể muốn hỏi một câu hỏi mới. Hi vọng điêu nay co ich.
Andy

@ user35734 nó không phù hợp nhưng tiệm quán.
Vim

17

Là một nhà thống kê y học không có kiến ​​thức về kinh tế (etr) ics trước đây, tôi đã phải vật lộn để nắm bắt các biến số công cụ vì tôi thường phải vật lộn để làm theo các ví dụ của họ và không hiểu thuật ngữ khá khác nhau của họ (ví dụ như 'nội sinh', 'hình thức giảm ',' phương trình cấu trúc ',' các biến bị bỏ qua '). Dưới đây là một vài tài liệu tham khảo tôi thấy hữu ích (đầu tiên nên có sẵn miễn phí, nhưng tôi sợ những người khác có thể yêu cầu đăng ký):

  • Staiger D. Biến công cụ. Hội thảo Cyber ​​Academy Cyber ​​trong Phương pháp nghiên cứu dịch vụ y tế, tháng 3/2002. http://www.dartmouth.edu/~dstaiger/wauge-Econ.htmlm

  • Newhouse JP, McClellan M. Kinh tế lượng trong nghiên cứu kết quả: Việc sử dụng các biến công cụ. Đánh giá thường niên về sức khỏe cộng đồng 1998; 19: 17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17

  • Greenland S. Giới thiệu về các biến công cụ cho các nhà dịch tễ học. Tạp chí quốc tế về dịch tễ học 2000; 29: 722-729. http://dx.doi.org/10.1093/ije/29.4.722

  • Zohoori N, Savitz DA. Phương pháp tiếp cận kinh tế lượng đến dữ liệu dịch tễ học: Liên quan đến tính nội sinh và tính không đồng nhất không quan sát được với sự nhầm lẫn. Biên niên sử dịch tễ học 1997; 7: 251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9

Tôi cũng muốn giới thiệu chương 4 của:

  • Angrist JD, Pischke JS. Chủ yếu là kinh tế lượng vô hại: bạn đồng hành của chủ nghĩa kinh nghiệm. Princeton, NJ: Nhà xuất bản Đại học Princeton, 2009. http://www.elylyharmlesseconometrics.com/

11

Dưới đây là một số slide mà tôi đã chuẩn bị cho một khóa học kinh tế lượng tại UC Berkeley.Tôi hy vọng rằng bạn thấy chúng hữu ích --- Tôi tin rằng họ trả lời câu hỏi của bạn và cung cấp một số ví dụ.

Ngoài ra còn có các phương pháp điều trị nâng cao hơn trên các trang khóa học cho PS 236 và PS 239 (các khóa học phương pháp khoa học chính trị cấp độ sau đại học) tại trang web của tôi: http://g Ribbon.bio/teaching.html .

Charlie


Liên kết đến các slide Berkeley không còn hiệu lực.
rolando2

7

Phi kỹ thuật (thường là tất cả những gì tôi tốt cho dù sao): Có những lúc X không chỉ gây ra Y mà cả Y cũng gây ra X. Biến công cụ là một thiết bị có thể "dọn sạch" mối quan hệ lộn xộn, bất tiện này để các ước tính tốt nhất có thể được tạo ra từ hiệu ứng của X trên Y.

Biến công cụ được chọn theo các mối quan hệ của nó: đó là nguyên nhân của X, nhưng, ngoài hành động thông qua X, nó không có tác dụng đối với Y. Công cụ (hoặc nhạc cụ) được sử dụng trong Giai đoạn Một để tính toán một phiên bản "mới" "Của X, một chức năng không phải là chức năng của Y. X" dự đoán "mới này sau đó được sử dụng trong giai đoạn thứ hai, trong một hồi quy chuẩn hơn, để giải thích / dự đoán Y. Do đó, thuật ngữ hồi quy Least Squares hai giai đoạn .

Người ta thường tìm thấy IV trong các quy trình được ghi đè hoặc vượt quá sự kiểm soát của X OR Y, chẳng hạn như các biến phụ thuộc vào luật pháp, chính sách, hành vi tự nhiên, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.