Hành động tương ứng với một can thiệp vào biến đặt nó thànhX xdo ( x )Xx . Khi chúng tôi can thiệp vào , điều này có nghĩa là cha mẹ của không ảnh hưởng đến giá trị của nó nữa, điều này tương ứng với việc loại bỏ các mũi tên chỉ vào Vì vậy, hãy biểu thị sự can thiệp này vào DAG mới.X XXXX
Hãy gọi phân phối quan sát ban đầu và phân phối sau can thiệp . Mục tiêu của chúng tôi là đưa ra về . Lưu ý rằng trong chúng tôi có mà . Ngoài ra, xác suất can thiệp trước và sau can thiệp chia sẻ hai bất biến này: và vì chúng tôi không chạm vào bất kỳ mũi tên nào nhập vào các biến đó trong sự can thiệp của chúng tôi. Vì thế:P ∗ P ∗ P P ∗ U ⊥ X P ∗ ( U ) = P ( U ) P ∗ ( Y | X , U ) = P ( Y | X , U )PP∗P∗PP∗U⊥XP∗(U)=P(U)P∗(Y|X,U)=P(Y|X,U)
P(Y|do(X)):=P∗(Y|X)=∑UP∗(Y|X,U)P∗(U|X)=∑UP∗(Y|X,U)P∗(U)=∑UP(Y|X,U)P(U)
Đạo hàm của cửa trước phức tạp hơn một chút. Đầu tiên lưu ý rằng không có sự nhầm lẫn giữa và , do đó,XZ
P(Z|do(X))=P(Z|X)
Ngoài ra, sử dụng cùng logic để lấy chúng ta thấy rằng việc kiểm soát là đủ để tạo ra hiệu ứng của trên , nghĩa làP(Y|do(X))XZY
P(Y|do(Z))=∑X′P(Y|X′,Z)P(X′)
Trong đó tôi đang sử dụng số nguyên tố để thuận tiện cho ký hiệu cho biểu thức tiếp theo. Vì vậy, hai biểu thức này đã được phân phối trước can thiệp và chúng tôi chỉ đơn giản sử dụng cơ sở lý luận backlink trước đó để lấy chúng.
Những mảnh cuối cùng chúng ta cần là để suy ra ảnh hưởng của trên kết hợp ảnh hưởng của trên và trên . Để làm điều đó, hãy chú ý trong biểu đồ , vì hiệu ứng của trên là hoàn toàn trung gian bởi và con đường backdoor từ đến bị chặn khi can thiệp vào . Vì thế:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX
P(Y|do(X))=∑ZP(Y|Z,do(X))P(Z|do(X))=∑ZP(Y|do(Z))P(Z|do(X))=∑Z∑X′P(Y|X′,Z)P(X′)P(Z|X)=∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)
Trong đó có thể được hiểu theo cách sau: khi tôi can thiệp vào , thì phân phối của thay đổi thành ; nhưng tôi thực sự đã can thiệp vào vì vậy tôi muốn biết có thường xuyên nhận một giá trị cụ thể khi tôi thay đổi , đó là .∑ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))
Do đó, hai điều chỉnh cung cấp cho bạn phân phối sau can thiệp giống nhau trên biểu đồ này, như chúng tôi đã chỉ ra.
Đọc lại câu hỏi của bạn, điều đó xảy ra với tôi, bạn có thể quan tâm trực tiếp cho thấy rằng phía bên phải của hai phương trình là bằng nhau trong phân phối trước can thiệp (mà chúng phải được đưa ra trước đây của chúng tôi). Điều đó không khó để thể hiện trực tiếp quá. Nó đủ cho thấy rằng trong DAG của bạn:
∑X′P(Y|Z,X′)P(X′)=∑UP(Y|Z,U)P(U)
Lưu ý rằng DAG ngụ ý và sau đó:Y⊥X|U,ZU⊥Z|X
∑X′P(Y|Z,X′)P(X′)=∑X′(∑UP(Y|Z,X′,U)P(U|Z,X′))P(X′)=∑X′(∑UP(Y|Z,U)P(U|X′))P(X′)=∑UP(Y|Z,U)∑X′P(U|X′)P(X′)=∑UP(Y|Z,U)P(U)
Vì thế:
∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)=∑ZP(Z|X)∑UP(Y|Z,U)P(U)=∑UP(U)∑ZP(Y|Z,U)P(Z|X)=∑UP(U)∑ZP(Y|Z,X,U)P(Z|X,U)=∑UP(Y|X,U)P(U)