Hai mô hình giai đoạn: Sự khác biệt giữa các mô hình Heckman (để đối phó với lựa chọn mẫu) và các biến Công cụ (để đối phó với nội sinh)


16

Tôi đang cố gắng tìm hiểu sự khác biệt giữa lựa chọn mẫu và tính nội sinh và đến lượt các mô hình Heckman (để đối phó với lựa chọn mẫu) khác với hồi quy biến công cụ (để đối phó với tính nội sinh).

Có đúng không khi nói rằng lựa chọn mẫu là một hình thức nội sinh cụ thể, trong đó biến nội sinh là khả năng được xử lý?

Ngoài ra, đối với tôi, cả mô hình Heckman và hồi quy IV đều là mô hình 2 giai đoạn, trong đó giai đoạn đầu tiên dự đoán khả năng được điều trị - tôi cho rằng chúng phải khác nhau về những gì chúng đang làm theo kinh nghiệm, mục tiêu và giả định của chúng, nhưng bằng cách nào?

Câu trả lời:


23

Để trả lời câu hỏi đầu tiên của bạn, bạn đã đúng rằng lựa chọn mẫu là một hình thức nội sinh cụ thể (Xem Antonakis và cộng sự 2010 để có đánh giá cơ bản tốt về nội sinh và các biện pháp phổ biến), tuy nhiên bạn không đúng khi nói rằng khả năng được điều trị là biến nội sinh, vì nó là biến điều trị ("chỉ định điều trị không ngẫu nhiên") - chứ không phải là khả năng được điều trị - đó là nội sinh trong lựa chọn mẫu. Hãy nhớ lại rằng tính đồng nhất đề cập đến một tình huống mà bạn đã xác định không chính xác mối quan hệ nhân quả giữa yếu tố X và yếu tố Y, khi mối quan hệ được quan sát thấy thực sự là do một yếu tố Z khác ảnh hưởng đến cả X và Y. Đặt một mô hình hồi quy khác :

yi=β0+β1xi+...+ϵTôi

tính nội sinh xảy ra khi một hoặc nhiều hơn một trong số các yếu tố dự đoán của bạn có liên quan đến thuật ngữ lỗi trong mô hình. Đó là, khi .Cov(x,ϵ)0

Các nguyên nhân phổ biến của nội sinh bao gồm:

  1. Các biến bị bỏ qua (một số thứ chúng ta không thể đo lường được)
    • Động lực / sự lựa chọn
    • Khả năng / tài năng
    • Tự chọn
  2. Lỗi đo lường (chúng tôi muốn bao gồm , nhưng chúng tôi chỉ quan sát )x j *xjxj
  3. Tính đồng thời / hai chiều (ở trẻ em dưới 5 tuổi, mối quan hệ giữa chỉ số về tình trạng dinh dưỡng Trọng lượng của tuổi già và liệu trẻ có bị bệnh gần đây có thể đồng thời hay không.

Các loại vấn đề khác nhau đòi hỏi các giải pháp hơi khác nhau, đó là điểm khác biệt giữa chỉnh sửa loại IV và Heckman. Tất nhiên có những khác biệt về cơ học cơ bản của các phương pháp này, nhưng tiền đề là như nhau: đó là loại bỏ tính nội sinh, lý tưởng là thông qua một hạn chế loại trừ, tức là một hoặc nhiều công cụ trong trường hợp IV hoặc một biến có ảnh hưởng đến lựa chọn nhưng không kết quả trong trường hợp của Heckman.

Để trả lời câu hỏi thứ hai của bạn, bạn phải suy nghĩ về sự khác biệt trong các loại hạn chế dữ liệu đã dẫn đến sự phát triển của các giải pháp này. Tôi muốn nghĩ rằng cách tiếp cận biến công cụ (IV) được sử dụng khi một hoặc nhiều biến là nội sinh, và đơn giản là không có proxy tốt để gắn vào mô hình để loại bỏ tính nội sinh, nhưng các kết quả và kết quả được quan sát cho tất cả các quan sát. Mặt khác, hiệu chỉnh kiểu Heckman được sử dụng khi bạn cắt ngắn, tức là thông tin không được quan sát cho những người trong mẫu có giá trị của biến chọn == 0.

Cách tiếp cận biến công cụ (IV)

Hãy nghĩ về ví dụ kinh tế lượng cổ điển cho hồi quy IV với công cụ ước lượng bình phương nhỏ nhất (2SLS) hai giai đoạn: ảnh hưởng của giáo dục đến thu nhập.

Earningsi=β0+β1OwnEdTôi+εTôi (1)

Ở đây mức độ thành tích giáo dục là nội sinh bởi vì nó được xác định một phần bởi động lực và khả năng của cá nhân, cả hai đều ảnh hưởng đến thu nhập của một người. Động lực và Khả năng thường không được đo lường trong các cuộc điều tra kinh tế hoặc hộ gia đình. Phương trình 1 do đó có thể được viết để bao gồm rõ ràng động lực và khả năng:

EmộtrnTôingSTôi= =β0+{β1ÔiwnEdTôi+β2MotTôivTôi+β3MộtbTôitôiTôi}+εTôi (2)

Vì và không thực sự được quan sát, phương trình 2 có thể được viết là:Một b i lMotTôivMộtbTôitôi

EmộtrnTôingSTôi= =β0+β1ÔiwnEdTôi+bạnTôi (3),

trong đó (4).bạnTôi= =β2MotTôivTôi+β3MộtbTôitôiTôi+εTôi

Do đó, một ước tính ngây thơ về ảnh hưởng của giáo dục đối với thu nhập thông qua OLS sẽ bị sai lệch. Phần này bạn đã biết.

Trước đây, mọi người đã sử dụng giáo dục của cha mẹ làm công cụ cho trình độ học vấn của chính đối tượng, vì chúng phù hợp với 3 yêu cầu đối với một công cụ hợp lệ ( ):z

  1. 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) 0z phải liên quan đến yếu tố dự đoán nội sinh - ,𝐶𝑜𝑣(𝑧,𝑥)0
  2. 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0z không thể liên quan trực tiếp đến kết quả - và𝐶𝑜𝑣(𝑧,𝑦)=0
  3. z 𝐶 𝑜 𝑣 ( 𝑧 , 𝑢 ) = 0z không thể liên quan đến đặc tính không quan sát được (u) (nghĩa là là ngoại sinh) -z𝐶𝑜𝑣(𝑧,𝑢)=0

Khi bạn ước tính giáo dục của đối tượng ( ) bằng cách sử dụng giáo dục của cha mẹ ( và ) ở giai đoạn đầu tiên và sử dụng giá trị dự đoán của giáo dục ( ) để ước tính ở giai đoạn thứ hai, bạn (theo thuật ngữ rất đơn giản) , ước tính dựa trên phần của không được xác định bởi động lực / khả năng.M o m E d D a d E d ^ O w n E d E a r n i n g s E a r n i n g s O w n E dOwnEdMomEdDadEdÔiwnEd^EmộtrnTôingSEmộtrnTôingSÔiwnEd

Chỉnh sửa kiểu Heckman

Như chúng tôi đã thiết lập trước đây, lựa chọn mẫu không ngẫu nhiên là một loại nội sinh cụ thể. Trong trường hợp này, biến bị bỏ qua là cách mọi người được chọn vào mẫu. Thông thường, khi bạn gặp vấn đề về chọn mẫu, kết quả của bạn chỉ được quan sát đối với những người chọn mẫu variable == 1. Vấn đề này còn được gọi là "cắt ngắn ngẫu nhiên", và giải pháp thường được gọi là điều chỉnh Heckman. Ví dụ kinh điển trong kinh tế lượng là đề nghị lương của phụ nữ đã kết hôn:

WmộtgeTôi= =β0+β1EdbạncTôi+β2ExperTôienceTôi+β3ExperTôienceTôi2+εTôi (5)

Vấn đề ở đây là chỉ được quan sát đối với những phụ nữ làm việc vì tiền lương, vì vậy một người ước tính ngây thơ sẽ bị thiên vị, vì chúng ta không biết đề nghị lương nào cho những người không tham gia lực lượng lao động, biến số lựa chọn . Phương trình 5 có thể được viết lại để chỉ ra rằng nó được xác định bởi hai mô hình tiềm ẩn:sWmộtgeS

WmộtgeTôi*= =Xβ'+εTôi (6)

LmộtborForceTôi*= =Zγ'+νTôi (7)

Đó là, IFF và IFFWmộtge= =WmộtgeTôi*LmộtborForceTôi*>0Wmộtge= =.LmộtborForceTôi*0

Do đó, giải pháp ở đây là dự đoán khả năng tham gia lực lượng lao động ở giai đoạn đầu tiên bằng cách sử dụng mô hình probit và hạn chế loại trừ (tiêu chí tương tự cho các công cụ hợp lệ được áp dụng ở đây), tính tỷ lệ nghịch đảo dự đoán ( ) cho mỗi quan sát và trong giai đoạn thứ hai, hãy ước tính đề nghị tiền lương bằng cách sử dụng làm công cụ dự đoán trong mô hình (Wooldridge 2009). Nếu hệ số trên bằng thống kê bằng 0, không có bằng chứng về lựa chọn mẫu (tính đồng nhất) và kết quả OLS phù hợp và có thể được trình bày. Nếu hệ số trênλ^λ^λ^λ^ là khác biệt có ý nghĩa thống kê so với số không, bạn sẽ cần báo cáo các hệ số từ mô hình đã sửa.

Người giới thiệu

  1. Antonakis, John, Samuel Bendahan, Philippe Jacquart và Rafael Lalive. Năm 2010, khi thực hiện các yêu cầu nhân quả: Đánh giá và khuyến nghị. Ban lãnh đạo hàng quý 21 (6): 1086 Từ1120. doi: 10.1016 / j.leaqua.2010.10.010.
  2. Wooldridge, Jeffrey M. 2009. Kinh tế lượng giới thiệu: Cách tiếp cận hiện đại. Tái bản lần thứ 4 Mason, OH, USA: South-Western, Cengage Learning.

1
Trong hiệu chỉnh kiểu Heckman, làm thế nào để giải thích các giá trị tỷ lệ nghịch đảo cho mỗi quan sát? Nó có nói số người sẽ làm việc từ dân số không làm việc tại một thời điểm nhất định không?
Quirik

2

Người ta phải phân biệt giữa mô hình chọn mẫu Heckman cụ thể (trong đó chỉ quan sát được một mẫu) và hiệu chỉnh kiểu Heckman để tự chọn, cũng có thể hoạt động trong trường hợp hai mẫu được quan sát. Cái sau được gọi là phương pháp tiếp cận chức năng kiểm soát và số tiền đưa vào giai đoạn thứ hai của bạn một thuật ngữ kiểm soát tính nội sinh.

Hãy để chúng tôi có một trường hợp tiêu chuẩn với một biến giả D nội sinh, một công cụ Z:

Y= =β+β1D+ε
D= =γ+γ1Z+bạn

Cả hai cách tiếp cận đều chạy một giai đoạn đầu tiên (D trên Z). IV sử dụng OLS tiêu chuẩn (ngay cả khi D là hình nộm) Heckman sử dụng probit. Nhưng bên cạnh đó, sự khác biệt chính là ở cách họ sử dụng giai đoạn đầu tiên này vào phương trình chính:

  • εY= =β+β1D^+ε
  • Y= =β+β1D+β2[λ(D^)-λ(-D^)]+ελ()

β2

Vì vậy, bạn có câu chuyện tiêu chuẩn rằng với các lỗi thông thường, chức năng điều khiển sẽ hiệu quả hơn (đặc biệt là nếu sử dụng MLE thay vì hai bước được hiển thị ở đây) so với IV, nhưng nếu giả định không giữ, IV sẽ tốt hơn. Khi các nhà nghiên cứu trở nên nghi ngờ hơn về giả định về tính quy tắc, IV được sử dụng thường xuyên hơn.


0

Từ Heckman, Urzua và Vytlacil (2006):

Ví dụ về sai lệch lựa chọn : Xem xét ảnh hưởng của chính sách đến kết quả của một quốc gia (ví dụ GDP). Nếu các quốc gia đã làm tốt về mặt không thể quan sát được ngay cả khi không có chính sách là những quốc gia áp dụng chính sách, thì ước tính OLS bị sai lệch.

Hai phương pháp chính đã được áp dụng để giải quyết vấn đề này: (a) mô hình lựa chọn và (b) mô hình biến công cụ.

Phương pháp lựa chọn mô hình mức độ của phương tiện có điều kiện. Cách tiếp cận IV mô hình độ dốc của các phương tiện có điều kiện. IV không xác định các hằng số ước tính trong các mô hình lựa chọn.

Cách tiếp cận IV không điều kiện trên D (điều trị). Công cụ ước tính lựa chọn (chức năng điều khiển) xác định các phương tiện có điều kiện bằng cách sử dụng các chức năng điều khiển.

ZX

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.