Câu trả lời của JohnRos là rất tốt. Trong tiếng Anh đơn giản, nội sinh có nghĩa là bạn đã hiểu sai nguyên nhân. Rằng mô hình bạn viết ra và ước tính không nắm bắt chính xác cách thức hoạt động của quan hệ nhân quả trong thế giới thực. Khi bạn viết:
Yi=β0+β1Xi+ϵi
bạn có thể nghĩ về phương trình này theo một số cách. Bạn có thể nghĩ về nó như một cách thuận tiện để dự đoán dựa trên các giá trị củaBạn có thể nghĩ về nó như một cách thuận tiện để mô hình hóa . Trong cả hai trường hợp này, không có gì gọi là nội sinh và bạn không cần phải lo lắng về điều đó.X E { Y | X }YXE{Y|X}
Tuy nhiên, bạn cũng có thể nghĩ phương trình là hiện thân nhân quả. Bạn có thể nghĩ là câu trả lời cho câu hỏi: "Điều gì sẽ xảy ra với nếu tôi truy cập vào hệ thống này và tăng thực nghiệm thêm 1?" Nếu bạn muốn nghĩ về nó theo cách đó, sử dụng OLS để ước tính số tiền giả định rằng: Y Xβ1YX
- YX gây raY
- Yϵ gây raY
- Xϵ không gây raX
- XY không gây raX
- Không có gì gây ra cũng gây raXϵX
Thất bại của bất kỳ một trong 3-5 sẽ thường dẫn đến , hoặc, không hoàn toàn tương đương, . Các biến công cụ là một cách sửa lỗi cho thực tế là bạn đã hiểu sai nguyên nhân (bằng cách đưa ra một giả định khác, khác, nguyên nhân). Một thử nghiệm ngẫu nhiên có kiểm soát được tiến hành hoàn hảo là cách buộc 3-5 là đúng. Nếu bạn chọn ngẫu nhiên, thì chắc chắn đó không phải do , hoặc bất cứ điều gì khác gây ra. Cái gọi là phương pháp "thí nghiệm tự nhiên" là những nỗ lực tìm kiếm những trường hợp đặc biệt trên thế giới nơi 3-5 là đúng ngay cả khi chúng ta không nghĩ 3-5 thường là đúng.C o v ( X , ε ) ≠ 0 X Y εE{ϵ|X}≠0Cov(X,ϵ)≠0XYϵ
Trong ví dụ của JohnRos, để tính giá trị tiền lương của giáo dục, bạn cần một cách giải thích nguyên nhân của , nhưng có những lý do chính đáng để tin rằng 3 hoặc 5 là sai.β1
Sự nhầm lẫn của bạn là dễ hiểu, mặc dù. Nó rất điển hình trong các khóa học về mô hình tuyến tính để người hướng dẫn sử dụng cách giải thích nguyên nhân của mà tôi đã đưa ra ở trên trong khi giả vờ không đưa ra quan hệ nhân quả, giả vờ rằng "tất cả chỉ là thống kê." Đó là một lời nói dối hèn nhát, nhưng nó cũng rất phổ biến. β1
Trên thực tế, nó là một phần của một hiện tượng lớn hơn trong y sinh và khoa học xã hội. Gần như luôn luôn là trường hợp mà chúng tôi đang cố gắng xác định tác động nhân quả của đối với --- đó là những gì khoa học nói về sau tất cả. Mặt khác, gần như luôn luôn có một câu chuyện mà bạn có thể kể dẫn đến một kết luận rằng một trong số 3-5 là sai. Vì vậy, có một loại thực tế, chất lỏng, không tương xứng trong đó chúng ta gạt bỏ sự phản đối bằng cách nói rằng chúng ta chỉ làm công việc liên kết và sau đó lén lút giải thích nguyên nhân ở nơi khác (thông thường trong phần giới thiệu và kết luận của bài báo).YXY
Nếu bạn thực sự quan tâm, anh chàng nên đọc là Judea Perl. James Heckman cũng tốt.
R
.