Những gì về nội sinh và những gì exogeneity có nghĩa là gì?


43

Tôi hiểu rằng định nghĩa cơ bản của tính nội sinh là không hài lòng, nhưng điều này có nghĩa gì trong ý nghĩa của thế giới thực? Tôi đọc bài viết trên Wikipedia, với ví dụ về cung và cầu, cố gắng hiểu ý nghĩa của nó, nhưng nó không thực sự có ích. Tôi đã nghe mô tả khác về nội sinh và ngoại sinh khi ở trong hệ thống và ở ngoài hệ thống và điều đó vẫn không có ý nghĩa với tôi.

Xϵ=0

1
Tất cả ba câu trả lời dưới đây đều rất hay (+1 cho mỗi câu). Nếu bạn muốn có một nguồn thông tin khác, tôi sẽ thảo luận về chủ đề này tại đây: Ước tính thay vìb 1 x 1 + b 2 x 2 + b 3 x 3b1x1+b2x2b1x1+b2x2+b3x3 và minh họa nó với mô phỏng R.
gung - Tái lập Monica

1
Khi bạn có tính nội sinh, hồi quy của bạn không còn có các công cụ ước tính hoặc thống kê kiểm tra có thể sử dụng được nữa.
Ivan

1
Tôi đồng ý với @gung và muốn nhấn mạnh rằng một câu trả lời hoàn chỉnh sẽ giải quyết "Có thể sử dụng cho mục đích gì "? Nhiều câu trả lời ở trên đối phó với câu hỏi này rất tốt.
Matthew Drury

@Matthew Dường như với tôi bài đăng này không cố gắng trả lời câu hỏi "điều này có nghĩa gì trong ý nghĩa thế giới thực?" Sẽ thật tuyệt khi thấy lời giải thích được bổ sung để mọi người có thể đánh giá cao nó hơn.
whuber

@whuber Tôi không biết, nó quá ngắn Tôi không thể nói được. Nhưng tôi đã nghĩ, ví dụ, mô hình ước tính có thể hữu ích cho dự đoán (hoặc chỉ liên kết) ngay cả khi bạn có tính nội sinh, do đó "không còn có công cụ ước tính có thể sử dụng" có vẻ sai mà không làm rõ.
Matthew Drury

Câu trả lời:


69

Câu trả lời của JohnRos là rất tốt. Trong tiếng Anh đơn giản, nội sinh có nghĩa là bạn đã hiểu sai nguyên nhân. Rằng mô hình bạn viết ra và ước tính không nắm bắt chính xác cách thức hoạt động của quan hệ nhân quả trong thế giới thực. Khi bạn viết:

Yi=β0+β1Xi+ϵi

bạn có thể nghĩ về phương trình này theo một số cách. Bạn có thể nghĩ về nó như một cách thuận tiện để dự đoán dựa trên các giá trị củaBạn có thể nghĩ về nó như một cách thuận tiện để mô hình hóa . Trong cả hai trường hợp này, không có gì gọi là nội sinh và bạn không cần phải lo lắng về điều đó.X E { Y | X }YXE{Y|X}

Tuy nhiên, bạn cũng có thể nghĩ phương trình là hiện thân nhân quả. Bạn có thể nghĩ là câu trả lời cho câu hỏi: "Điều gì sẽ xảy ra với nếu tôi truy cập vào hệ thống này và tăng thực nghiệm thêm 1?" Nếu bạn muốn nghĩ về nó theo cách đó, sử dụng OLS để ước tính số tiền giả định rằng: Y Xβ1YX

  1. YX gây raY
  2. Yϵ gây raY
  3. Xϵ không gây raX
  4. XY không gây raX
  5. Không có gì gây ra cũng gây raXϵX

Thất bại của bất kỳ một trong 3-5 sẽ thường dẫn đến , hoặc, không hoàn toàn tương đương, . Các biến công cụ là một cách sửa lỗi cho thực tế là bạn đã hiểu sai nguyên nhân (bằng cách đưa ra một giả định khác, khác, nguyên nhân). Một thử nghiệm ngẫu nhiên có kiểm soát được tiến hành hoàn hảo là cách buộc 3-5 là đúng. Nếu bạn chọn ngẫu nhiên, thì chắc chắn đó không phải do , hoặc bất cứ điều gì khác gây ra. Cái gọi là phương pháp "thí nghiệm tự nhiên" là những nỗ lực tìm kiếm những trường hợp đặc biệt trên thế giới nơi 3-5 là đúng ngay cả khi chúng ta không nghĩ 3-5 thường là đúng.C o v ( X , ε ) 0 X Y εE{ϵ|X}0Cov(X,ϵ)0XYϵ

Trong ví dụ của JohnRos, để tính giá trị tiền lương của giáo dục, bạn cần một cách giải thích nguyên nhân của , nhưng có những lý do chính đáng để tin rằng 3 hoặc 5 là sai.β1

Sự nhầm lẫn của bạn là dễ hiểu, mặc dù. Nó rất điển hình trong các khóa học về mô hình tuyến tính để người hướng dẫn sử dụng cách giải thích nguyên nhân của mà tôi đã đưa ra ở trên trong khi giả vờ không đưa ra quan hệ nhân quả, giả vờ rằng "tất cả chỉ là thống kê." Đó là một lời nói dối hèn nhát, nhưng nó cũng rất phổ biến. β1

Trên thực tế, nó là một phần của một hiện tượng lớn hơn trong y sinh và khoa học xã hội. Gần như luôn luôn là trường hợp mà chúng tôi đang cố gắng xác định tác động nhân quả của đối với --- đó là những gì khoa học nói về sau tất cả. Mặt khác, gần như luôn luôn có một câu chuyện mà bạn có thể kể dẫn đến một kết luận rằng một trong số 3-5 là sai. Vì vậy, có một loại thực tế, chất lỏng, không tương xứng trong đó chúng ta gạt bỏ sự phản đối bằng cách nói rằng chúng ta chỉ làm công việc liên kết và sau đó lén lút giải thích nguyên nhân ở nơi khác (thông thường trong phần giới thiệu và kết luận của bài báo).YXY

Nếu bạn thực sự quan tâm, anh chàng nên đọc là Judea Perl. James Heckman cũng tốt.


5
+1 Giải thích và bình luận tuyệt vời. Chào mừng đến với trang web của chúng tôi!.
whuber

2
Bạn có thể nói rõ công việc nào của Heckman mà bạn đề xuất, để có được sự hiểu biết cơ bản và vững chắc về vấn đề này?
Kenny LJ

Tôi có một câu hỏi: làm thế nào để kiểm tra xem hay có đúng không khi sử dụng dữ liệu của bạn (chứ không phải kiến ​​thức tên miền của bạn) có thể không đến từ thử nghiệm, nghĩa là , tập dữ liệu quan sát tập trung? Tôi cảm thấy rằng không có cách nào để kiểm tra hoặc chỉ sử dụng dữ liệu, vì không thể quan sát được, vậy có đúng là sự đồng nhất có thể được kiểm tra bằng dữ liệu không? E[ϵ|X]=0E[ϵX]=0E[ϵ|X]=0E[ϵX]=0ϵ
KevinKim

1
@KevinKim Vâng. không thể kiểm tra bằng cách sử dụng số liệu thống kê. không thể được phục hồi / ước tính trừ khi thực hiện ước tính và sau đó thực hiện dư. Việc phục hồi chỉ có thể được thực hiện sau khi ước tính. Việc khôi phục chỉ đúng nếu việc ước tính được thực hiện chính xác. Việc ước tính chỉ được thực hiện chính xác nếu . Vì vậy, thông tư. Thông tin mà phải xuất phát từ kiến ​​thức thực tế, không thống kê. Một ví dụ về điều này là trong đó là phần dư OLS. Điều này đúng bất kể liệu . ε E { ε | X } = 0 E { ε | X } = 0 C o v { X , e } = 0 e E { ϵ | X } = 0E{ϵ|X}=0ϵE{ϵ|X}=0E{ϵ|X}=0Cov{X,e}=0eE{ϵ|X}=0
Hóa đơn

2
@KevinKim Đúng vậy. Và nó không chỉ là mô hình tuyến tính. Đó là tất cả các số liệu thống kê. Lưu ý, khi ai đó nói rằng "mối tương quan không phải là nhân quả", họ sẽ không bao giờ nói với bạn điều gì nhân quả. Nhân quả là lý thuyết và chỉ có thể là lý thuyết. Ngay cả một RCT (hoàn hảo --- và do đó không bao giờ --- tiến hành) cũng không cho bạn biết nguyên nhân mà không có lý thuyết.
Bill

18

Hãy để tôi sử dụng một ví dụ:

Nói rằng bạn muốn định lượng ảnh hưởng (nhân quả) của giáo dục đối với thu nhập. Bạn mất nhiều năm học và dữ liệu thu nhập và hồi quy cái này với cái kia. Bạn đã phục hồi những gì bạn muốn? Chắc là không! Điều này là do thu nhập cũng được gây ra bởi những thứ khác ngoài giáo dục, nhưng có liên quan đến giáo dục. Chúng ta hãy gọi chúng là "kỹ năng": Chúng ta có thể giả định một cách an toàn rằng các năm học bị ảnh hưởng bởi "kỹ năng", vì bạn càng có nhiều kỹ năng, bạn càng dễ dàng có được giáo dục. Vì vậy, nếu bạn hồi quy năm giáo dục về thu nhập, công cụ ước tính cho hiệu ứng giáo dục sẽ hấp thụ hiệu quả của "kỹ năng" và bạn có được ước tính quá lạc quan về lợi nhuận của giáo dục. Điều này có nghĩa là, ảnh hưởng của giáo dục đối với thu nhập là (tăng) thiên vị vì giáo dục không phải là ngoại sinh đối với thu nhập.

Nội sinh chỉ là một vấn đề nếu bạn muốn phục hồi các hiệu ứng nhân quả (không giống như các mối tương quan đơn thuần). Ngoài ra- nếu bạn có thể thiết kế một thử nghiệm, bạn có thể đảm bảo rằng bằng cách gán ngẫu nhiên. Đáng buồn thay, điều này thường là không thể trong khoa học xã hội.Cov(X,ϵ)=0


1
Cảm ơn ví dụ và lời giải thích. Tôi vẫn còn một chút không biết gì về tính đồng nhất và ngoại sinh có nghĩa là gì trong tiếng Anh. Chính xác ý tôi là gì khi tôi nói rằng một biến là nội sinh hoặc cho vấn đề đó ngoại sinh.
user25901

@ JohnRos Bạn đã viết "Nội sinh chỉ là vấn đề nếu bạn muốn phục hồi hiệu ứng nhân quả" thì có vẻ như tôi cũng có thể nói rằng: "exogeneity ngụ ý nhân quả" ... Tuy nhiên tôi không bao giờ đọc cụm từ đó ... Nếu nó đúng, có vẻ như nhiều sách giáo khoa, đôi khi mặc nhiên, giả sử suy luận nguyên nhân là mục tiêu bình thường.
markowitz

@markowitz: Bất cứ khi nào bạn suy luận về hệ số hồi quy, điều đó có nghĩa là bạn muốn nhân quả. Nếu bạn chỉ muốn dự đoán, giá trị của các hệ số không thực sự quan trọng, miễn là dự đoán đó tốt. Đúng là sách giáo khoa cổ điển không tạo ra sự khác biệt này bởi vì trước nhiệm vụ dự đoán không phải là "khoa học cơ bản" mà là "kỹ thuật" hơn (và tha thứ cho tôi về sự khái quát thô thiển này)
JohnRos

Cảm ơn JohnRos, hãy để tôi hỏi một câu hỏi khác về một điểm liên quan. Vấn đề ước lượng sai lệch của các hệ số chỉ có ý nghĩa trong mô hình hồi quy nguyên nhân trong khi đối với các mục tiêu dự đoán chắc chắn là không. Đúng rồi? Tôi hỏi điều này bởi vì điểm này không rõ ràng ở bất cứ nơi nào.
markowitz

8

User25901 đang tìm kiếm một lời giải thích đơn giản, thực tế về thế giới thực, các thuật ngữ ngoại sinh và nội sinh có nghĩa là gì. Trả lời với các ví dụ phức tạp hoặc định nghĩa toán học không thực sự trả lời câu hỏi đã được hỏi.

Làm thế nào để tôi có được sự hiểu biết ruột của hai thuật ngữ này?

Đây là những gì tôi nghĩ ra:

Exo - bên ngoài, bên ngoài Endo - bên trong, bên trong -genous - bắt nguồn từ

Ngoại sinh: Một biến là ngoại sinh đối với một mô hình nếu nó không được xác định bởi các tham số và biến khác trong mô hình, nhưng được đặt bên ngoài và mọi thay đổi đối với nó đến từ các lực bên ngoài.

Nội sinh: Một biến là nội sinh trong một mô hình nếu nó ít nhất là một phần chức năng của các tham số và biến khác trong một mô hình.


7
Đây là những định nghĩa trực quan hợp lý, nhưng không cần phải quá coi thường các câu trả lời khác.
gung - Phục hồi Monica

3
Việc thu hút từ nguyên có thể đưa ra một cách xử lý hữu ích để ghi nhớ các thuật ngữ kỹ thuật có nghĩa là gì (nó hoạt động tốt với tôi), nhưng sử dụng từ nguyên để biện minh cho chúng là điều cần tránh. Khá nhiều thuật ngữ (trong thống kê và các nơi khác) chỉ được hiểu đúng thông qua nghiên cứu cẩn thận các định nghĩa toán học của họ. Hiểu câu trả lời này đòi hỏi một khái niệm rõ ràng về mục đích sử dụng của các từ và cụm từ như "được xác định bởi", "đặt bên ngoài", "thay đổi thành", "ngoại lực" và "một phần [a] chức năng", không một trong số đó ngay lập tức Rõ ràng hoặc không rõ ràng.
whuber

6

Hồi quy OLS, bằng cách xây dựng, cho . Thật ra điều đó không đúng. Nó cho bằng cách xây dựng. Phần dư ước tính của bạn không tương quan với các biến hồi quy của bạn, nhưng phần dư ước tính của bạn là "sai" theo nghĩa. X ' ε = 0Xϵ=0Xϵ^=0

Nếu quy trình tạo dữ liệu thực sự hoạt động bởi và tương quan với , thì nếu bạn phù hợp một hồi quy rời ra . Tất nhiên, các số dư ước tính sẽ không tương quan với . Chúng luôn như vậy, giống như cách . Nó chỉ là một thực tế toán học. Đây là sự thiên vị biến bị bỏ qua. Z X X n o i s e0 Z X log ( e x ) = xY=α+βX+γZ+noiseZXXnoise0ZXlog(ex)=x

Nói rằng được chỉ định ngẫu nhiên. Có lẽ đó là ngày trong tuần mà mọi người được sinh ra. Có lẽ nó là một thử nghiệm thực tế. Đó là bất cứ điều gì không tương quan với là dự đoán . Sau đó bạn có thể sử dụng tính ngẫu nhiên của để dự đoán , và sau đó sử dụng dự đoán để phù hợp với một mô hình để . Y X Tôi X X YIYXIXXY

Đó là hai ô vuông nhỏ nhất, gần giống như IV.


Theo tôi hiểu không phải là 2SLS một cách để làm IV, xin lỗi nếu tôi nhầm.
user25901

Lỗi tiêu chuẩn 2SLS là sai. Tôi quên tại sao hoặc làm thế nào, nhưng có lẽ bạn sẽ tìm thấy thứ gì đó nếu bạn google "IV 2SLS lỗi tiêu chuẩn". Hầu hết các gói phần mềm triển khai 2 giây với phương thức giải (t (z)% *% (x)% *% t (z)% *% y
generic_user

1
X^X

Cảm ơn. Tôi đã mới ra khỏi kinh tế lượng ứng dụng khi tôi viết bài này.
generic_user 17/2/2017

-1

Trong hồi quy, chúng tôi muốn nắm bắt tác động định lượng của một biến độc lập (mà chúng tôi giả sử là ngoại sinh và bản thân nó không phụ thuộc vào một thứ khác) trên một biến phụ thuộc đã xác định. Chúng tôi muốn biết tác động ròng của một biến ngoại sinh đối với biến phụ thuộc - có nghĩa là biến độc lập sẽ không có bất kỳ ảnh hưởng nào từ biến khác. Một cách nhanh chóng để xem liệu hồi quy có phải chịu vấn đề nội sinh hay không là kiểm tra mối tương quan giữa biến độc lập và phần dư. Nhưng đây chỉ là một kiểm tra sơ bộ nếu không các xét nghiệm chính thức về tính nội sinh cần phải được thực hiện.


3
Điều này không đúng. Mối tương quan giữa phần dư và các biến giải thích từ hồi quy bằng 0 khi xây dựng. Đây không phải là một thử nghiệm cho tính nội sinh.
Andy

E[ϵX]=0ϵy=b0+b1x+ϵϵE[e^i|x]=0e^iE[e^i|x]=0b^0+b^1x
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.