Không có mâu thuẫn giữa thế giới thực tế và hành động quan tâm ở cấp độ can thiệp. Ví dụ, hút thuốc cho đến hôm nay và bị buộc phải bỏ hút thuốc bắt đầu từ ngày mai không mâu thuẫn với nhau, mặc dù bạn có thể nói một người phủ nhận khác. Nhưng bây giờ hãy tưởng tượng kịch bản sau đây. Bạn biết Joe, một người hút thuốc cả đời bị ung thư phổi, và bạn tự hỏi: nếu Joe không hút thuốc trong ba mươi năm, liệu hôm nay anh ta có khỏe không? Trong trường hợp này, chúng ta đang làm việc với cùng một người, trong cùng một thời gian, tưởng tượng ra một kịch bản trong đó hành động và kết quả là mâu thuẫn trực tiếp với các sự kiện đã biết.
Do đó, điểm khác biệt chính của các biện pháp can thiệp và phản tác dụng là ở chỗ, trong khi đó, bạn đang hỏi trung bình điều gì sẽ xảy ra nếu bạn thực hiện một hành động, thì ngược lại, bạn đang hỏi điều gì sẽ xảy ra nếu bạn thực hiện một hành động khác trong một tình huống cụ thể , cho rằng bạn có thông tin về những gì thực sự đã xảy ra. Lưu ý rằng, vì bạn đã biết những gì đã xảy ra trong thế giới thực, bạn cần cập nhật thông tin của mình về quá khứ trước những bằng chứng bạn đã quan sát.
Hai loại truy vấn này là khác biệt về mặt toán học vì chúng yêu cầu các mức thông tin khác nhau phải được trả lời (phản tác dụng cần nhiều thông tin hơn để được trả lời) và thậm chí ngôn ngữ phức tạp hơn để được khớp nối!.
Với thông tin cần thiết để trả lời Rung 3 câu hỏi, bạn có thể trả lời Rung 2 câu hỏi, nhưng không phải là cách khác. Chính xác hơn, bạn không thể trả lời các câu hỏi phản tác dụng chỉ bằng thông tin can thiệp. Các ví dụ trong đó xảy ra xung đột giữa các can thiệp và phản tác dụng đã được đưa ra ở đây trong CV, xem bài đăng này và bài đăng này . Tuy nhiên, để hoàn thiện, tôi cũng sẽ đưa ra một ví dụ ở đây.
Ví dụ dưới đây có thể được tìm thấy trong Nhân quả, mục 1.4.4.
Hãy xem xét rằng bạn đã thực hiện một thử nghiệm ngẫu nhiên trong đó bệnh nhân được chỉ định ngẫu nhiên (50% / 50%) cho điều trị ( ) và điều kiện kiểm soát ( ), và trong cả hai nhóm điều trị và kiểm soát đã phục hồi 50% ( ) và 50% đã chết ( ). Đó là .x = 1x = 0y= 0y= 1P( y| x)=0,5∀x,y
Kết quả của thí nghiệm cho bạn biết rằng hiệu quả nhân quả trung bình của can thiệp là bằng không. Đây là một câu hỏi 2 bậc, .P( Y= 1 | do ( X= 1 ) ) - P( Y= 1 | do ( X= 0 ) = 0
Nhưng bây giờ chúng ta hãy đặt câu hỏi sau đây: bao nhiêu phần trăm những bệnh nhân tử vong khi điều trị sẽ hồi phục nếu họ không điều trị? Về mặt toán học, bạn muốn tính . P( Y0= 0 | X= 1 , Y= 1 )
Câu hỏi này không thể được trả lời chỉ với dữ liệu can thiệp mà bạn có. Bằng chứng rất đơn giản: Tôi có thể tạo hai mô hình nhân quả khác nhau sẽ có cùng các phân phối can thiệp, nhưng các phân phối phản tác dụng khác nhau. Hai được cung cấp dưới đây:
Ở đây, lên đến các yếu tố không quan sát được giải thích cách bệnh nhân phản ứng với điều trị. Bạn có thể nghĩ về các yếu tố giải thích sự không đồng nhất trong điều trị, ví dụ. Lưu ý phân phối biên của cả hai mô hình đồng ý.BạnP( y, x )
Lưu ý rằng, trong mô hình đầu tiên, không ai bị ảnh hưởng bởi việc điều trị, do đó tỷ lệ phần trăm những bệnh nhân tử vong khi điều trị sẽ hồi phục nếu họ không điều trị bằng không.
Tuy nhiên, trong mô hình thứ hai, mọi bệnh nhân đều bị ảnh hưởng bởi việc điều trị và chúng tôi có một hỗn hợp gồm hai quần thể trong đó hiệu ứng nhân quả trung bình hóa ra bằng không. Trong ví dụ này, số lượng phản tác dụng hiện nay lên tới 100% --- trong Mô hình 2, tất cả các bệnh nhân tử vong khi điều trị sẽ hồi phục nếu họ không điều trị.
Do đó, có sự phân biệt rõ ràng của nấc 2 và nấc 3. Như ví dụ cho thấy, bạn không thể trả lời các câu hỏi không chính xác chỉ bằng thông tin và giả định về các can thiệp. Điều này được làm rõ với ba bước để tính toán một phản tác dụng:
- Bước 1 (bắt cóc): cập nhật xác suất của các yếu tố không quan sát được theo các bằng chứng quan sát đượcP( u )P( u | e )
- Bước 2 (hành động): thực hiện hành động trong mô hình (ví dụ .do ( x ) )
- Bước 3 (dự đoán): dự đoán trong mô hình đã sửa đổi.Y
Điều này sẽ không thể tính toán nếu không có một số thông tin chức năng về mô hình nguyên nhân hoặc không có một số thông tin về các biến tiềm ẩn.