Hiệu quả nhân quả bằng cách điều chỉnh cửa sau và cửa trước


12

Nếu chúng ta muốn tính hiệu ứng nhân quả của trên trong biểu đồ nhân quả bên dưới, chúng ta có thể sử dụng cả hai định lý điều chỉnh cửa sau và điều chỉnh cửa trước, tức là Y P ( y | do ( X = x ) ) = u P ( y | x , u ) P ( u )XY

P(y|do(X=x))=uP(y|x,u)P(u)

P(y|do(X=x))=zP(z|x)xP(y|x,z)P(x).

Đây có phải là một bài tập về nhà dễ dàng để chỉ ra rằng hai điều chỉnh dẫn đến cùng một tác động nhân quả của đối với ?YXY

Đồ thị


Đây có phải là một bài tập về nhà thực sự? Sau đó, vui lòng thêm thẻ tự học. Sau đó mọi người có thể cho bạn gợi ý, để lại suy nghĩ (và học tập) cho bạn. Hãy cho chúng tôi những gì bạn đã cố gắng và nơi bạn đang bị mắc kẹt. Hãy nhớ CV không phải để thuê ngoài bài tập về nhà ...
Knarpie

4
Xin chào Knarpie, nó là một phần của việc tự học và không phải là bài tập về nhà. Tôi hiện đang đọc "Suy luận nguyên nhân trong thống kê" của Pearl et al. và dành khoảng 1 giờ để suy ngẫm về câu hỏi tôi đã hỏi ở trên, vì đây là một câu hỏi tự nhiên để hỏi, nhưng không thể cho thấy sự bình đẳng. Hoặc là tôi đang thiếu một cái gì đó ở đây, hoặc hai biểu thức không bằng nhau.
Jae

Câu trả lời:


12

Hành động tương ứng với một can thiệp vào biến đặt nó thànhX xdo(x)Xx . Khi chúng tôi can thiệp vào , điều này có nghĩa là cha mẹ của không ảnh hưởng đến giá trị của nó nữa, điều này tương ứng với việc loại bỏ các mũi tên chỉ vào Vì vậy, hãy biểu thị sự can thiệp này vào DAG mới.X XXXX

nhập mô tả hình ảnh ở đây

Hãy gọi phân phối quan sát ban đầu và phân phối sau can thiệp . Mục tiêu của chúng tôi là đưa ra về . Lưu ý rằng trong chúng tôi có mà . Ngoài ra, xác suất can thiệp trước và sau can thiệp chia sẻ hai bất biến này: và vì chúng tôi không chạm vào bất kỳ mũi tên nào nhập vào các biến đó trong sự can thiệp của chúng tôi. Vì thế:P P P P U X P ( U ) = P ( U ) P ( Y | X , U ) = P ( Y | X , U )PPPPPUXP(U)=P(U)P(Y|X,U)=P(Y|X,U)

P(Y|do(X)):=P(Y|X)=UP(Y|X,U)P(U|X)=UP(Y|X,U)P(U)=UP(Y|X,U)P(U)

Đạo hàm của cửa trước phức tạp hơn một chút. Đầu tiên lưu ý rằng không có sự nhầm lẫn giữa và , do đó,XZ

P(Z|do(X))=P(Z|X)

Ngoài ra, sử dụng cùng logic để lấy chúng ta thấy rằng việc kiểm soát là đủ để tạo ra hiệu ứng của trên , nghĩa làP(Y|do(X))XZY

P(Y|do(Z))=XP(Y|X,Z)P(X)

Trong đó tôi đang sử dụng số nguyên tố để thuận tiện cho ký hiệu cho biểu thức tiếp theo. Vì vậy, hai biểu thức này đã được phân phối trước can thiệp và chúng tôi chỉ đơn giản sử dụng cơ sở lý luận backlink trước đó để lấy chúng.

Những mảnh cuối cùng chúng ta cần là để suy ra ảnh hưởng của trên kết hợp ảnh hưởng của trên và trên . Để làm điều đó, hãy chú ý trong biểu đồ , vì hiệu ứng của trên là hoàn toàn trung gian bởi và con đường backdoor từ đến bị chặn khi can thiệp vào . Vì thế:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX

P(Y|do(X))=ZP(Y|Z,do(X))P(Z|do(X))=ZP(Y|do(Z))P(Z|do(X))=ZXP(Y|X,Z)P(X)P(Z|X)=ZP(Z|X)XP(Y|X,Z)P(X)

Trong đó có thể được hiểu theo cách sau: khi tôi can thiệp vào , thì phân phối của thay đổi thành ; nhưng tôi thực sự đã can thiệp vào vì vậy tôi muốn biết có thường xuyên nhận một giá trị cụ thể khi tôi thay đổi , đó là .ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))

Do đó, hai điều chỉnh cung cấp cho bạn phân phối sau can thiệp giống nhau trên biểu đồ này, như chúng tôi đã chỉ ra.


Đọc lại câu hỏi của bạn, điều đó xảy ra với tôi, bạn có thể quan tâm trực tiếp cho thấy rằng phía bên phải của hai phương trình là bằng nhau trong phân phối trước can thiệp (mà chúng phải được đưa ra trước đây của chúng tôi). Điều đó không khó để thể hiện trực tiếp quá. Nó đủ cho thấy rằng trong DAG của bạn:

XP(Y|Z,X)P(X)=UP(Y|Z,U)P(U)

Lưu ý rằng DAG ngụ ý và sau đó:YX|U,ZUZ|X

XP(Y|Z,X)P(X)=X(UP(Y|Z,X,U)P(U|Z,X))P(X)=X(UP(Y|Z,U)P(U|X))P(X)=UP(Y|Z,U)XP(U|X)P(X)=UP(Y|Z,U)P(U)

Vì thế:

ZP(Z|X)XP(Y|X,Z)P(X)=ZP(Z|X)UP(Y|Z,U)P(U)=UP(U)ZP(Y|Z,U)P(Z|X)=UP(U)ZP(Y|Z,X,U)P(Z|X,U)=UP(Y|X,U)P(U)

1
Đây là một câu trả lời rất tốt và đầy đủ. Tuy nhiên, bit mà bạn xác định hiệu ứng nhân quả thông qua cửa trước là không cần thiết (OP đã thực hiện và nó đi thẳng từ định lý cửa trước) và nó cũng có một lỗi: Không có "luật tổng thể xác suất "cho các hiệu ứng nhân quả. Nghĩa là, thường không bằng , mà là , khác biệt rõ ràng. Xem cuốn sách Ngọc trai lớn ở trang 87--88.P(Y|do(X))ZP(Y|do(Z))P(Z|do(X)ZP(Y|Z,do(X))P(Z|do(X))
Julian Schuessler

@JulianSchuessler đó là lý do tại sao tôi viết Lát có thể được coi là Rằng, như một cách để giúp hiểu, nhưng không phải theo nghĩa đen. Về việc phái sinh ở cửa trước, OP không biết làm thế nào để có được nó, đó là lý do tại sao tôi đặt nó ở đó.
Carlos Cinelli

Câu trả lời chính xác. Cảm ơn, Carlos. Phần thứ hai của câu trả lời của bạn là chính xác những gì tôi yêu cầu. Tôi có hai câu hỏi tiếp theo ở đây. 1) Chiến lược tìm kiếm nào bạn đã sử dụng để điều khiển đại số các biểu thức trong câu trả lời thứ hai của bạn? (Bằng cách nheo mắt đủ lâu tại các biểu thức?) Vì không gian tìm kiếm lớn, tôi tự hỏi làm thế nào một thuật toán có thể được viết để có thể tự động đi đến kết luận tương tự.
Jae

2) Tôi cũng bối rối với cách diễn giải , vì trực giác đầu tiên của tôi giống như đề xuất của Julian. Nhưng Pearl Cuốn sách mà tôi đã đề cập sử dụng biểu thức của bạn. Tôi tự hỏi, nói chung, khi bao thanh toán một chuỗi có hướng trong đó nút bắt đầu là nút nguyên nhân và nút kết thúc là hiệu ứng, mỗi yếu tố phải được điều chỉnh trên chứ không phải trên , trong đó là một ghi chú trung gian trong chuỗi.do ( Z ) Z ZzP(Y|do(Z)P(Z|do(X))do(Z)ZZ
Jae

1
@Jeevaka đây là một giả định được mã hóa trong DAG, ngụ ý bởi yếu tố của nó và giả định rằng hệ thống này bao gồm các phần mô-đun, tự trị. Do đó, những thay đổi trong không ảnh hưởng đến . Một cách để giúp suy nghĩ về điều này là viết ra các phương trình cấu trúc của cả hai mô hình (mô hình quan sát) và (mô hình can thiệp) và sau đó rút ra các phân phối ngụ ý và . Bạn sẽ thấy rằng điều kiện của cho và sẽ giống nhau ở cả hai. P ( Y | X , U ) M M P P Y X UP(X,U)P(Y|X,U)MMPPYXU
Carlos Cinelli
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.