Điều gì xảy ra nếu các biến kiểm soát của người Viking cũng là nội sinh?


13

Tôi làm việc trong Kinh tế chính trị, và rất nhiều mô hình bao gồm các biến kiểm soát "vô tội" như dân số, bất bình đẳng, di sản thuộc địa, v.v. để tác giả có thể tuyên bố không thiên vị về biến quan tâm độc lập của họ.

Nhưng nếu bất kỳ biến kiểm soát nào trong số này là nội sinh với một số biến bị bỏ qua, thì điều này có làm ô nhiễm tính không thiên vị của TẤT CẢ các biến độc lập không?

Nếu đó là sự thật thì chúng ta có thể làm gì? Để các biến kiểm soát đó ra ngoài và chúng dẫn đến sai lệch biến thiên. Bao gồm những người trong và họ sẽ làm ô nhiễm mọi thứ trong mô hình.

Ví dụ: Một nhà nghiên cứu muốn biết liệu bất bình đẳng có dẫn đến bạo lực hay không và anh ta kiểm soát một số điều: Thấy rằng Bất bình đẳng có khả năng là nội sinh ( bởi vì mức độ biến đổi của lòng vị tha ), anh ta sẽ cố gắng tìm một biến công cụ cho bất bình đẳng . Nhưng không phải Tăng trưởngPhát triển có khả năng là nội sinh (tức là tương quan với Mức độ vị tha )?

Violence=Inequality+Growth+Development+ϵ

Ví dụ này có vẻ ngớ ngẩn, nhưng quan điểm của tôi là trong công tác Phát triển / Kinh tế Chính trị, có rất nhiều yếu tố đang diễn ra (chưa được bỏ qua) đến nỗi tôi sợ nhiều biến trong LHS là nội sinh. Tuy nhiên, thông thường, các nhà nghiên cứu chỉ tìm kiếm một công cụ cho biến độc lập vật nuôi của mình mà thôi.


Tuy nhiên, một điều khác cần xem xét là vấn đề được gọi là "kiểm soát xấu" - một tình huống khi chính kiểm soát là một biến kết quả. Tôi sẽ đề nghị bạn đọc Phần 3.2.3 trong cuốn "Kinh tế học vô hại" nổi tiếng của Angrist và Pischke để hiểu rõ hơn về chủ đề này và tại sao nó lại quan trọng nếu bạn muốn hiểu rõ hơn về câu hỏi của mình.
MauOlivares

Câu trả lời:


10

"Nhưng nếu bất kỳ biến kiểm soát nào trong số này là nội sinh với một số biến bị bỏ qua, thì điều này có làm ô nhiễm tính không thiên vị của TẤT CẢ các biến độc lập không?"

Tôi không muốn nhấn mạnh điều này quá nhiều, nhưng nói chung là điều này không đúng. Các dẫn xuất sau đây hy vọng sẽ cung cấp một số hiểu biết về "ô nhiễm" mà bạn đề cập. Như một ví dụ đơn giản, giả sử rằng quy trình tạo dữ liệu được đưa ra bởi trong đó không quan sát được. Đặt , và . Sau đó, rõ ràng là "nội sinh". Nhưng lưu ý rằng vì , ước tính của chúng tôi về vẫn sẽ ổn: Z C o v ( X 1 , Z ) = 0 C o v ( X 2 , Z ) 0 C o v ( X 1 , X 2 ) = 0 X 2 C o v ( X 1 ,

Y=X1β1+X2β2+Zγ+ε,
ZCov(X1,Z)=0Cov(X2,Z)0Cov(X1,X2)=0X2β 1 plimCov(X1,Z)=0β1X1 =M2X1M2=[I-X2(X2 X2)-1X2 ]Cov(X1,X2)=0X1 =X1Co
plimβ^1=β1+γCov(X1,Z)Var(X1)=β1,
trong đó và . Vì , . Vậy .X1=M2X1M2=[IX2(X2X2)1X2]Cov(X1,X2)=0X1=X1Cov(X1,Z)=0

"Chúng ta có thể làm gì?"

Một trong những thách thức chính của việc làm kinh tế lượng tốt là nghĩ đến các chiến lược nhận dạng tiềm năng. Trong loại tình huống bạn mô tả, có lẽ bạn không thể làm gì ngoài việc cố gắng tiếp cận vấn đề theo một cách khác.


Mặc dù bạn đúng về mặt kỹ thuật, tôi sẽ không nhấn mạnh điểm này. Tôi muốn nói rằng nói chung, chúng ta không thể loại trừ sự thiên vị của bất kỳ biến nào, thay vì nói trong một số tình huống, nó ổn , bởi vì chúng ta thường không biết DGP.
FooBar

1) Bạn có thể chỉ cho tôi một tài liệu tham khảo nơi β có nguồn gốc theo cách này? Tôi đã không được dạy điều này trong kinh tế lượng của tôi. 2) Bạn sử dụng C o v ( X 1 , Z ) = 0 trong chứng minh ở đâu? Có vẻ như C o v ( X 1 , X - 2 ) = 0 là đủ. 3) Tôi đồng ý với @FooBar rằng C o v ( X 1 , X 2 ) = 0 là ngoại lệ, không phải là tiêu chuẩn. Thật vậy, nếu Cβ^Cov(X1,Z)=0Cov(X1,X2)=0Cov(X1,X2)=0 chúng tôi sẽ không kiểm soát X 2 ở vị trí đầu tiên (ngoại trừ để tăng độ chính xác). Cov(X1,X2)=0X2
Heisenberg

@FooBar, tôi đồng ý. Tôi đã cập nhật bài viết để nhấn mạnh rằng đây là trường hợp đặc biệt. Theo như quan điểm về việc không biết DGP, đó là sự thật. Nhưng đó không phải là vấn đề. Bất kỳ phân tích nào cũng phải đưa ra các giả định về DGP và chất lượng phân tích phụ thuộc vào chất lượng của các giả định. Đạo hàm tôi đưa ra chỉ để minh họa một ví dụ về các giả định (mặc dù, các giả định rất mạnh) có thể đưa bạn đến nơi bạn muốn đến.
jmbejara

@Heisenberg: 1) Bạn có thể mở một câu hỏi mới về vấn đề này không? Nếu bạn chỉ sao chép và dán đạo hàm và trình bày câu hỏi của bạn, đó sẽ là tốt nhất. 2) là cần thiết khi tôi nói rằng C o v ( X 1 , Z ) = 0 . 3) Bạn nói đúng. Nếu chúng ta quan tâm đến việc dự đoán Y , nó sẽ rất quan trọng. Nhưng, vâng, đó là một điểm tốt. Mặt khác, có thể hữu ích khi lưu ý rằng kích thước của độ lệch phụ thuộc vào mức độ tương quan mà bạn tin X 1XCov(X1,Z)=0Cov(X1,Z)=0YX1 để được. X2
jmbejara

1
@jmbejara Tôi đã đăng 1) dưới dạng một câu hỏi riêng biệt . Xin vui lòng chỉnh sửa câu hỏi / tiêu đề của tôi, vì tôi không biết cách diễn đạt tiêu đề một cách thông minh và hữu ích cho Googler trong trường hợp này.
Heisenberg

6

Tất cả là quá mạnh, nhưng có lẽ một số. Vấn đề này được gọi là "bôi nhọ". Hãy xem bằng chứng trong các bài giảng của Greene trên slide 5.

Emily Oster có một bài viết hay (và lệnh Stata psacalc) có thể giúp ràng buộc sự thiên vị.


5

Trong bối cảnh ước lượng Least-squares, cách chúng ta phải (cố gắng) đối phó với tính nội sinh có thể có của các biến hồi quy là thông qua ước lượng Biến Công cụ. Cách tiếp cận này không phụ thuộc vào việc chỉ có một hồi quy nội sinh - bạn có thể có nhiều. Trong trường hợp như vậy tất nhiên bạn cần tìm thêm các công cụ khiến mọi thứ trở nên khó khăn hơn - nhưng về nguyên tắc, phương pháp sẽ hoạt động theo cùng một cách.

Ước tính IV không giải quyết được vấn đề sai lệch, nó chỉ cung cấp tính nhất quán cho người ước tính. Nhưng không có gì giải quyết được vấn đề của thanh thiên vị nghiêm ngặt ngoại sinh (và sau đó có một số phương pháp giảm sai lệch). Nhưng nếu bạn xem qua một trang web SE khác, Xác thực chéo , đó là về thống kê, bạn sẽ thấy rằng các nhà thống kê dày dạn thực sự không chú trọng nhiều đến tính chất không thiên vị - họ tập trung vào Hiệu quả trung bình cho các thuộc tính mẫu hữu hạn, và về tính nhất quán cho các thuộc tính mẫu lớn.


1
Vì vậy, cách tiếp cận chính xác là thực sự tìm thấy các công cụ cho tất cả các biến nội sinh, phải không?
Heisenberg

1
Vâng, đây là cách.
Alecos Papadopoulos

5

Đây là một ví dụ về điều mà nhà thống kê Andrew Gelman gọi là "sai lầm của việc kiểm soát kết quả trung gian". Dưới đây là mô tả của ông về ngụy biện này xuất hiện khi các nhà nghiên cứu hỏi liệu có nhiều con gái thay đổi chính trị của bạn. Quyết định sinh con thứ hai nhất thiết phải có điều kiện dựa trên quyết định có con đầu lòng trước đó, và do đó có vẻ như là một ví dụ rõ ràng về việc kiểm soát biến quyết định là nội sinh.

Một số nghiên cứu đã được thực hiện trong vài năm qua, xem xét các quyết định kinh tế của cha mẹ của con trai, so với cha mẹ của con gái .... Một đặc điểm chung của tất cả các nghiên cứu này là chúng kiểm soát tổng số trẻ em ... Lần đầu tiên nhìn thấy, kiểm soát tổng số trẻ em có vẻ hợp lý. Tuy nhiên, có một khó khăn là tổng số trẻ em là kết quả trung gian và việc kiểm soát nó (cho dù bằng cách đặt lại dữ liệu dựa trên #kids hoặc sử dụng #kids làm biến kiểm soát trong mô hình hồi quy) có thể làm sai lệch ước tính về tác động nhân quả của việc có con trai (hoặc con gái).

Để thấy điều này, giả sử (giả thiết) rằng cha mẹ bảo thủ chính trị có nhiều khả năng muốn có con trai, và nếu họ có hai con gái, họ (theo giả thuyết) có nhiều khả năng cố gắng sinh con thứ ba. So sánh, những người tự do có nhiều khả năng dừng lại ở hai cô con gái. Trong trường hợp này, nếu bạn xem dữ liệu về các gia đình có 2 con gái, những người bảo thủ sẽ bị đánh giá thấp và dữ liệu có thể cho thấy mối tương quan giữa con gái với chủ nghĩa tự do chính trị, ngay cả khi việc con gái không có tác dụng gì cả! ...

Một giải pháp là áp dụng cách tiếp cận bảo thủ tiêu chuẩn (theo nghĩa thống kê!) Cho suy luận nguyên nhân, đó là hồi quy biến điều trị của bạn (giới tính của trẻ) nhưng chỉ kiểm soát những điều xảy ra trước khi đứa trẻ được sinh ra. Chẳng hạn, người ta có thể so sánh cha mẹ có con đầu lòng là con gái với bố mẹ có con đầu lòng. Người ta cũng có thể nhìn vào lần sinh thứ hai, so sánh cha mẹ có con thứ hai là con gái với những đứa con thứ hai là con trai kiểm soát giới tính của đứa con đầu lòng. Và như vậy cho đứa con thứ ba, v.v.

Có con trai làm cho bạn bảo thủ hơn? Co le không. Một vấn đề với việc kiểm soát một kết quả trung gian

Về nhận xét của bạn rằng "Bỏ các biến kiểm soát đó ra và chúng dẫn đến sai lệch biến thiên.", Điều này dường như phụ thuộc vào loại công cụ bạn nhận được. Một công cụ tốt, một công cụ thực sự thỏa mãn các yêu cầu, phải độc lập với thuật ngữ lỗi trong giai đoạn thứ hai và độc lập với mọi thứ khác mà bạn kiểm soát trực tiếp . Đó là, công cụ chỉ thay đổi Y thông qua X. Vì vậy, một công cụ phù hợp cho sự bất bình đẳng phải độc lập với tăng trưởng và phát triển (chúc may mắn tìm thấy điều đó!) Nếu chúng ta tin rằng phương trình bạo lực là phương trình cấu trúc của bạo lực.


1

Như các bài viết khác đã chỉ ra, các hồi quy nội sinh có thể làm ô nhiễm tất cả các ước tính tham số trong hồi quy khi các hồi quy tương quan.

Hơn nữa, có vẻ khó có thể hình dung một tình huống trong đó, giả sử, X 2 có mối tương quan với nhau và X 2 là nội sinh nhưng X 1 thì không.X1X2X2X1

Tuy nhiên, ít hơn những gì cần thiết để ổn định đảm bảo β 1 ngay cả khi X 2 là nội sinh và X 1X 2 có tương quan.β^1X2X1X2

Hãy xem xét mô hình sau (tương tự ký hiệu của @ jmbejara)

y=X1β1+X2β2+Zγ+ε,

không quan sát được, với các giả định thông thường exogeneity wrt ε , tức là 1Zε11nx1(k)εp0cho tất cảkhồi quy. X2là nội sinh theo nghĩa11nx2(k)εp0kX2đối với một số cặp biến(k,l).1nx1(k)z(l)p0(k,l)

Bây giờ nếu là nội sinh nhưng X 1 không có nghĩa là tất cả mối tương quan giữa X 1Z sẽ biến mất sau khi kiểm soát X 2X2X1X1ZX2 , nghĩa là,

1nx1(k)'QX2z(tôi)p0
(k,tôi)QX2X2QX2[Tôin-X2(X2'X2)-1X2']sau đó chúng tôi ổn Lý do được nhìn thấy từ công cụ ước tính hai bước sau đây của (ví dụ Amemiya, 1985, trang 6-7):β1

β^1= =(X1'QX2X1)-1X1'QX2y= =β1+(X1'QX2X1)-1X1'QX2X2p0β2+(X1'QX2X1)-1X1'QX2Zp0γ+(X1'QX2X1)-1X1'QX2εp0
X1X2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.