Để trả lời câu hỏi đầu tiên của bạn, bạn đã đúng rằng lựa chọn mẫu là một hình thức nội sinh cụ thể (Xem Antonakis và cộng sự 2010 để có đánh giá cơ bản tốt về nội sinh và các biện pháp phổ biến), tuy nhiên bạn không đúng khi nói rằng khả năng được điều trị là biến nội sinh, vì nó là biến điều trị ("chỉ định điều trị không ngẫu nhiên") - chứ không phải là khả năng được điều trị - đó là nội sinh trong lựa chọn mẫu. Hãy nhớ lại rằng tính đồng nhất đề cập đến một tình huống mà bạn đã xác định không chính xác mối quan hệ nhân quả giữa yếu tố X và yếu tố Y, khi mối quan hệ được quan sát thấy thực sự là do một yếu tố Z khác ảnh hưởng đến cả X và Y. Đặt một mô hình hồi quy khác :
yTôi= β0+ β1xTôi+ . . . + εTôi
tính nội sinh xảy ra khi một hoặc nhiều hơn một trong số các yếu tố dự đoán của bạn có liên quan đến thuật ngữ lỗi trong mô hình. Đó là, khi .Cov(x,ϵ)≠0
Các nguyên nhân phổ biến của nội sinh bao gồm:
- Các biến bị bỏ qua (một số thứ chúng ta không thể đo lường được)
- Động lực / sự lựa chọn
- Khả năng / tài năng
- Tự chọn
- Lỗi đo lường
(chúng tôi muốn bao gồm , nhưng chúng tôi chỉ quan sát )x j *xjxj∗
- Tính đồng thời / hai chiều (ở trẻ em dưới 5 tuổi, mối quan hệ giữa chỉ số về tình trạng dinh dưỡng Trọng lượng của tuổi già và liệu trẻ có bị bệnh gần đây có thể đồng thời hay không.
Các loại vấn đề khác nhau đòi hỏi các giải pháp hơi khác nhau, đó là điểm khác biệt giữa chỉnh sửa loại IV và Heckman. Tất nhiên có những khác biệt về cơ học cơ bản của các phương pháp này, nhưng tiền đề là như nhau: đó là loại bỏ tính nội sinh, lý tưởng là thông qua một hạn chế loại trừ, tức là một hoặc nhiều công cụ trong trường hợp IV hoặc một biến có ảnh hưởng đến lựa chọn nhưng không kết quả trong trường hợp của Heckman.
Để trả lời câu hỏi thứ hai của bạn, bạn phải suy nghĩ về sự khác biệt trong các loại hạn chế dữ liệu đã dẫn đến sự phát triển của các giải pháp này. Tôi muốn nghĩ rằng cách tiếp cận biến công cụ (IV) được sử dụng khi một hoặc nhiều biến là nội sinh, và đơn giản là không có proxy tốt để gắn vào mô hình để loại bỏ tính nội sinh, nhưng các kết quả và kết quả được quan sát cho tất cả các quan sát. Mặt khác, hiệu chỉnh kiểu Heckman được sử dụng khi bạn cắt ngắn, tức là thông tin không được quan sát cho những người trong mẫu có giá trị của biến chọn == 0.
Cách tiếp cận biến công cụ (IV)
Hãy nghĩ về ví dụ kinh tế lượng cổ điển cho hồi quy IV với công cụ ước lượng bình phương nhỏ nhất (2SLS) hai giai đoạn: ảnh hưởng của giáo dục đến thu nhập.
Earningsi=β0+β1OwnEdi+ϵi (1)
Ở đây mức độ thành tích giáo dục là nội sinh bởi vì nó được xác định một phần bởi động lực và khả năng của cá nhân, cả hai đều ảnh hưởng đến thu nhập của một người. Động lực và Khả năng thường không được đo lường trong các cuộc điều tra kinh tế hoặc hộ gia đình. Phương trình 1 do đó có thể được viết để bao gồm rõ ràng động lực và khả năng:
Ea r n i n gSTôi= β0+ { Β1O w n EdTôi+ β2Mo t i vTôi+ β3A b i lTôi} + ΕTôi (2)
Vì và không thực sự được quan sát, phương trình 2 có thể được viết là:Một b i lMo t i vA b i l
Ea r n i n gSTôi= β0+ β1O w n EdTôi+ bạnTôi (3),
trong đó (4).bạnTôi= β2Mo t i vTôi+ β3A b i lTôi+ εTôi
Do đó, một ước tính ngây thơ về ảnh hưởng của giáo dục đối với thu nhập thông qua OLS sẽ bị sai lệch. Phần này bạn đã biết.
Trước đây, mọi người đã sử dụng giáo dục của cha mẹ làm công cụ cho trình độ học vấn của chính đối tượng, vì chúng phù hợp với 3 yêu cầu đối với một công cụ hợp lệ ( ):z
- 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) ≠ 0z phải liên quan đến yếu tố dự đoán nội sinh - ,Cov(z,x)≠0
- 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0z không thể liên quan trực tiếp đến kết quả - vàCov(z,y)=0
- z 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0z không thể liên quan đến đặc tính không quan sát được (u) (nghĩa là là ngoại sinh) -zC o v ( z , u )=0
Khi bạn ước tính giáo dục của đối tượng ( ) bằng cách sử dụng giáo dục của cha mẹ ( và ) ở giai đoạn đầu tiên và sử dụng giá trị dự đoán của giáo dục ( ) để ước tính ở giai đoạn thứ hai, bạn (theo thuật ngữ rất đơn giản) , ước tính dựa trên phần của không được xác định bởi động lực / khả năng.M o m E d D a d E d ^ O w n E d E a r n i n g s E a r n i n g s O w n E dO w n EdMo m EdD a dEdO w n EdˆEa r n i n gSEa r n i n gSO w n Ed
Chỉnh sửa kiểu Heckman
Như chúng tôi đã thiết lập trước đây, lựa chọn mẫu không ngẫu nhiên là một loại nội sinh cụ thể. Trong trường hợp này, biến bị bỏ qua là cách mọi người được chọn vào mẫu. Thông thường, khi bạn gặp vấn đề về chọn mẫu, kết quả của bạn chỉ được quan sát đối với những người chọn mẫu variable == 1
. Vấn đề này còn được gọi là "cắt ngắn ngẫu nhiên", và giải pháp thường được gọi là điều chỉnh Heckman. Ví dụ kinh điển trong kinh tế lượng là đề nghị lương của phụ nữ đã kết hôn:
Wmột geTôi= β0+ β1Edbạn cTôi+ β2Ex p e r i e n c eTôi+ β3Ex p e r i e n c e2Tôi+ εTôi (5)
Vấn đề ở đây là chỉ được quan sát đối với những phụ nữ làm việc vì tiền lương, vì vậy một người ước tính ngây thơ sẽ bị thiên vị, vì chúng ta không biết đề nghị lương nào cho những người không tham gia lực lượng lao động, biến số lựa chọn . Phương trình 5 có thể được viết lại để chỉ ra rằng nó được xác định bởi hai mô hình tiềm ẩn:sWmột geS
Wmột ge*Tôi= Xβ'+ εTôi (6)
L a b o r Fo r c e*Tôi= Zγ'+ νTôi (7)
Đó là, IFF và IFFWmột ge = Wmột ge*TôiL a b o r Fo r c e*Tôi> 0Wmột ge = .L a b o r Fo r c e*Tôi≤ 0
Do đó, giải pháp ở đây là dự đoán khả năng tham gia lực lượng lao động ở giai đoạn đầu tiên bằng cách sử dụng mô hình probit và hạn chế loại trừ (tiêu chí tương tự cho các công cụ hợp lệ được áp dụng ở đây), tính tỷ lệ nghịch đảo dự đoán ( ) cho mỗi quan sát và trong giai đoạn thứ hai, hãy ước tính đề nghị tiền lương bằng cách sử dụng làm công cụ dự đoán trong mô hình (Wooldridge 2009). Nếu hệ số trên bằng thống kê bằng 0, không có bằng chứng về lựa chọn mẫu (tính đồng nhất) và kết quả OLS phù hợp và có thể được trình bày. Nếu hệ số trênλ^λ^λ^λ^ là khác biệt có ý nghĩa thống kê so với số không, bạn sẽ cần báo cáo các hệ số từ mô hình đã sửa.
Người giới thiệu
- Antonakis, John, Samuel Bendahan, Philippe Jacquart và Rafael Lalive. Năm 2010, khi thực hiện các yêu cầu nhân quả: Đánh giá và khuyến nghị. Ban lãnh đạo hàng quý 21 (6): 1086 Từ1120. doi: 10.1016 / j.leaqua.2010.10.010.
- Wooldridge, Jeffrey M. 2009. Kinh tế lượng giới thiệu: Cách tiếp cận hiện đại. Tái bản lần thứ 4 Mason, OH, USA: South-Western, Cengage Learning.