Định nghĩa toán học của quan hệ nhân quả


9

Đặt YX là các biến ngẫu nhiên. E(Y|X) là giá trị trung bình có điều kiện của Y cho X . Chúng ta nói Y không liên quan đến nhân quả Xnếu E(Y|X) không phụ thuộc vào X , điều đó hàm ý nó bằng E(Y) . Bây giờ, chúng ta hãy đi cùng với định nghĩa về quan hệ nhân quả này trong một giây. Theo định luật lặp lại kỳ vọng, E(XE(Y|X))= =E(E(XY|X))= =E(XY) . Điều này có nghĩa là nếuE(Y|X) không phụ thuộc vàoX , nếu nó bằngE(Y) , thìE(X)E(Y)= =E(XY) .

Nói cách khác:

Nếu Y không liên quan đến nhau, thì XXYX không tương quan! - Điều này vô nghĩa và tôi biết điều này phải sai. Tôi đã xác định quan hệ nhân quả không chính xác? Tôi đã làm gì sai?Y

Trong toán kinh tế chúng ta thường giả định . Vậy E ( Y | X ) = E ( Y ) tương đương với b 1 = 0 . Logic áp dụng trong kịch bản cụ thể này quá.E(Y|X)= =b0+b1XE(Y|X)= =E(Y)b1= =0


2
Bạn nói rằng . Tôi tin rằng điều này là sai. E (Y | X) là một hằng số. Do đó, E ( X E ( Y | X ) ) bằng E ( Y | X ) E ( X ) . Một điểm khác, E ( |E(XE(Y|X))= =E(E(XY|X))= =E(XY)E(XE(Y|X))E(Y|X)E(X) xuất phát từ mô hình hồi quy tuyến tính đơn giản. E(Y|X)= =b0+b1*X
BudhORG

Đặt E (Y | X) = b, trong đó b là hằng số. Sau đó lấy kỳ vọng của cả hai bên. Người ta thấy rằng E (E (Y | X)) = E (b) = b. Theo luật kỳ vọng lặp lại, E (E (Y | X)) = E (Y). Do đó, nếu E (Y | X) không đổi thì phải bằng E (Y).
Christian

Nếu E (Y / X) = b, điều đó có nghĩa là Y không phụ thuộc vào X và E (Y) = b, bạn đang tự nhầm lẫn.
SAAN

Tôi không hiểu tại sao "điều này vô nghĩa". Bạn đang bắt đầu với một định nghĩa về quan hệ nhân quả mà tôi nghĩ tương đương với định nghĩa về tính độc lập trong thống kê. Và các biến độc lập có hiệp phương sai bằng 0, câu chuyện ở đâu?
Ngày

Tháng một, không, chúng không giống nhau! X và Y là độc lập nếu các yếu tố phân phối chung vào sản phẩm của các lề, và điều này chắc chắn không giống nhau. Tôi không thấy quan điểm của bạn là gì? Azeem, ngoài việc nghỉ ngơi những gì tôi đã nói trước đây, bạn có gì để đóng góp không? Thay vì nói tôi sai, bạn có thể giải thích TẠI SAO tôi sai không?
Christian

Câu trả lời:


18

Bạn đã xác định quan hệ nhân quả không chính xác, vâng. Có lẽ, bạn đã nghe câu nói "tương quan không phải là nhân quả". Về cơ bản, bạn đã xác định quan hệ nhân quả là tương quan. Vấn đề còn tồi tệ hơn thế. Nhân quả hoàn toàn không phải là một khái niệm thống kê hoặc xác suất, ít nhất là những chủ đề đó thường được dạy. Không có định nghĩa thống kê hoặc xác suất của quan hệ nhân quả: không có gì liên quan đến các kỳ vọng có điều kiện hoặc phân phối có điều kiện hoặc tương tự. Mặc dù vậy, thật khó để nhận ra thực tế này từ các khóa học về thống kê hoặc kinh tế lượng.

Thật không may, chúng ta có xu hướng làm một công việc tốt hơn nói rằng nhân quả không phải là nhân quả là gì. Nhân quả luôn luôn và ở mọi nơi xuất phát từ lý thuyết, từ một lý luận tiên nghiệm, từ các giả định. Bạn đã đề cập đến kinh tế lượng. Nếu bạn đã được dạy các biến công cụ thành thạo, thì bạn biết rằng tác động nhân quả chỉ có thể được đo lường nếu bạn có "hạn chế loại trừ". Và bạn biết rằng những hạn chế loại trừ luôn xuất phát từ lý thuyết.

Bạn nói rằng bạn muốn toán học, mặc dù. Anh chàng mà bạn muốn đọc là Judea Pearl . Đó không phải là môn toán dễ dàng và toán học đôi khi đi sâu vào triết học, nhưng đó là vì nhân quả là một môn học khó. Đây là một trang có nhiều liên kết về chủ đề này. Đây là một cuốn sách trực tuyến miễn phí tôi vừa đi qua. Cuối cùng, đây là một câu hỏi trước đây mà tôi đã đưa ra một câu trả lời mà bạn có thể thấy hữu ích.


Xin chân thành cảm ơn. Tôi sẽ đọc tác phẩm của anh ấy và lấy lại cho bạn khi tôi có thời gian.
Christian

4
Câu trả lời tuyệt vời. Các Morgan & Winship cuốn sách là khá một chút dễ dàng hơn Pearl, với một tập trung vào các vấn đề khoa học xã hội.
Dimitriy V. Masterov

8

Chúng ta nói không liên quan đến X một cách nhân quả nếu E ( Y | X ) không phụ thuộc vào X , điều đó hàm ý nó bằng E ( Y ) .YXE(Y|X)XE(Y)

Cái này sai. Quan hệ nhân quả là về phụ thuộc chức năng / cấu trúc, không phụ thuộc thống kê / liên kết. Bạn nên xem ở đây.

Tôi đã xác định quan hệ nhân quả không chính xác? Tôi đã làm gì sai?

Có, bạn đã xác định nó không chính xác, bạn có thể kiểm tra sách / tài liệu tham khảo nguyên nhân ở đây . Chính thức hơn, trong một mô hình phương trình cấu trúc, tác động nhân quả của lên sự phân bố của Y , mà chúng ta có thể biểu thị bằng P ( Y | d o ( X = x ) ) --- nghĩa là, việc thay đổi X ảnh hưởng đến phân phối của Y --- được định nghĩa toán học là phân phối xác suất gây ra bởi mô hình phương trình cấu trúc đã sửa đổi trong đó phương trình của X được thay thế cho X = x .XYP(Y|do(X= =x))XYXX= =x

Ví dụ: giả sử mô hình nhân quả của bạn được xác định bởi các phương trình cấu trúc sau:

U=ϵuX=f(U,ϵx)Y=g(X,U,ϵy)

Trong đó các nhiễu loạn là độc lập lẫn nhau và có một số phân phối xác suất. Điều này tương ứng với DAG:

nhập mô tả hình ảnh ở đây

Khi đó là phân phối xác suất của Y gây ra bởi các phương trình cấu trúc được sửa đổi:P(Y|do(X=x))Y

Bạn= =εbạnX= =xY= =g(X,Bạn,εy)

Tương ứng với DAG bị cắt xén:

nhập mô tả hình ảnh ở đây

Hiệu ứng nhân quả trung bình sẽ chỉ đơn giản là kỳ vọng của sử dụng cdf P ( Y | d o ( X = x ) ) .YP(Y|do(X= =x))

E[Y|do(X= =x)]= =YdP(Y|do(X= =x))

Đây là định nghĩa toán học, việc bạn có thể xác định hiệu ứng với dữ liệu quan sát hay không phụ thuộc vào việc bạn có thể biểu thị lại theo cách phân phối quan sát mà không cần toán tử d o ( ) hay không .P(Y|do(X= =x))do()


3

Một ví dụ

Vấn đề dường như không phải là sự độc lập có nghĩa là (điều kiện mà ) ngụ ý rằng YX không tương quan. Nếu XY không tương quan với nhau, thì nói chung không có nghĩa là chúng độc lập. Vì vậy, điều này dường như không có vấn đề cho đến nay.E[Y|X]= =E[Y]YXXY

Tuy nhiên, giả sử bạn có mối quan hệ (chúng ta có thể gọi nó là quan hệ nhân quả) được định nghĩa là , trong đó X được phân phối với phân phối chuẩn thông thường và W được phân phối với phân phối Rademacher sao cho W = 1 hoặc - 1 , mỗi xác suất 1 / 2 ( xem bài viết Wikipedia này ). Sau đó lưu ý rằng E [ Y | X ] = E [ Y ] . Theo định nghĩa của bạn, mối quan hệ này sẽ không phải là nguyên nhân mặc dù YY= =WXXWW=111/2E[Y|X]=E[Y]Yrõ ràng phụ thuộc vào .X

Một ví dụ về cách suy nghĩ chính thức về quan hệ nhân quả

Để cung cấp cho bạn một cách rõ ràng và toán học hơn để xem xét quan hệ nhân quả, hãy lấy ví dụ sau đây. (Tôi mượn ví dụ này từ cuốn sách "Kinh tế lượng vô hại.") Giả sử bạn muốn phân tích ảnh hưởng của việc nhập viện đối với sức khỏe. Xác định là một số đo sức khỏe của cá nhân iD i{ 0 , 1 } để cho biết liệu cá nhân đó có phải nhập viện hay không. Trong nỗ lực đầu tiên của chúng tôi, giả sử chúng tôi xem xét sự khác biệt trung bình về sức khỏe của hai loại cá nhân: E [ Y i | D i = 1 ] - E [YiiDi{0,1} Trước tiên, nhìn vào dữ liệu, bạn có thể nhận thấy, phản biện bằng trực giác, rằng những người đã nhập viện thực sự có sức khỏe kém hơn những người không có. Tuy nhiên, đi đến bệnh viện chắc chắn không làm cho người ta bệnh nặng hơn. Thay vào đó, có một sự lựa chọn thiên vị. Những người đến bệnh viện là những người có sức khỏe kém hơn. Vì vậy, biện pháp đầu tiên này không hoạt động. Tại sao? Bởi vì chúng tôi không quan tâm đến chỉ nhữngkhác biệtđược quan sát, mà là những khác biệt tiềm năng (chúng tôi muốn biết điều gì sẽ xảy ra trong thế giới thực tế).

E[Yi|Di=1]E[Yi|Di=0].

Potential Outcome={Y1,iif Di=1Y0,iif Di=0.
Y0,iiY1,i
Yi={Y1,iif Di=1Y0,iif Di=0.
Yi=Y0,i+(Y1,iY0,i)DiY1,iY0,i
E[YTôi|DTôi= =1]-E[YTôi|DTôi= =0]= =E[Y1,Tôi|DTôi= =1]-E[Y0,Tôi|DTôi= =1]+E[Y0,Tôi|DTôi= =1]-E[Y0,Tôi|DTôi= =0].
E[Y1,Tôi|DTôi= =1]-E[Y0,Tôi|DTôi= =1]E[Y0,Tôi|DTôi= =1]-E[Y0,Tôi|DTôi= =0]DTôi
E[YTôi|DTôi= =1]-E[YTôi|DTôi= =0]= =E[Y1,Tôi|DTôi]-E[Y0,Tôi|DTôi= =0]= =E[Y1,Tôi|DTôi]-E[Y0,Tôi|DTôi= =1]= =E[Y1,Tôi-Y0,Tôi|DTôi= =1]= =E[Y1,Tôi-Y0,Tôi],
E[Y1,Tôi-Y0,Tôi]

1

E()E(Y|X)=E(Y)E(XY)=E(X)E(Y)

Tuy nhiên, tôi không thấy vấn đề của bạn ở đâu?

  1. XY
  2. XY

Ví dụ: xem xét bảng sau:

     Y
 X | -1      0      1
 --+---------------------
-1 | 0.25    0     0.25
 1 |   0    0.5      0

P(X=1Y=0)=0.5

E(Y)=E(X)=E(XY)=0E(Y|X=1)=E(Y|X=1)=0E(Y|X)=E(X)

E(XY)=E(X)E(Y)

P(X=1Y=0)=0.50.50.5=P(X=1)P(Y=0)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.