Sự khác biệt giữa bậc hai và ba trong Thang nhân quả

12

Trong "Cuốn sách tại sao" của Judea Pearl, ông nói về cái mà ông gọi là Thang nhân quả, về cơ bản là một hệ thống phân cấp bao gồm các cấp độ lý luận nhân quả khác nhau. Thấp nhất liên quan đến các mô hình liên kết trong dữ liệu được quan sát (ví dụ: tương quan, xác suất có điều kiện, v.v.), tiếp theo tập trung vào can thiệp (điều gì xảy ra nếu chúng ta cố tình thay đổi quá trình tạo dữ liệu theo một cách nào đó?), Và thứ ba là phản tác dụng (điều gì sẽ xảy ra ở một thế giới khác có thể xảy ra nếu có chuyện gì đó xảy ra hoặc không xảy ra)?

Điều tôi không hiểu là cách hai và ba khác nhau. Nếu chúng ta hỏi một câu hỏi ngược, chúng ta không chỉ đơn giản là hỏi một câu hỏi về việc can thiệp để phủ nhận một số khía cạnh của thế giới quan sát?

causality

— DS
nguồn

Đây thực sự là về chủ đề? Hỏi về sự tò mò

— Firebird

5

@Fireorms là nhân quả về chủ đề? Nếu bạn muốn tính xác suất của các tác dụng phụ (chẳng hạn như xác suất một loại thuốc cụ thể là đủ cho cái chết của ai đó), bạn cần phải hiểu điều này.

— Carlos Cinelli

5

twitter.com/yudapearl/status/1069533953223155713 !

— Tim

13

Không có mâu thuẫn giữa thế giới thực tế và hành động quan tâm ở cấp độ can thiệp. Ví dụ, hút thuốc cho đến hôm nay và bị buộc phải bỏ hút thuốc bắt đầu từ ngày mai không mâu thuẫn với nhau, mặc dù bạn có thể nói một người phủ nhận khác. Nhưng bây giờ hãy tưởng tượng kịch bản sau đây. Bạn biết Joe, một người hút thuốc cả đời bị ung thư phổi, và bạn tự hỏi: nếu Joe không hút thuốc trong ba mươi năm, liệu hôm nay anh ta có khỏe không? Trong trường hợp này, chúng ta đang làm việc với cùng một người, trong cùng một thời gian, tưởng tượng ra một kịch bản trong đó hành động và kết quả là mâu thuẫn trực tiếp với các sự kiện đã biết.

Do đó, điểm khác biệt chính của các biện pháp can thiệp và phản tác dụng là ở chỗ, trong khi đó, bạn đang hỏi trung bình điều gì sẽ xảy ra nếu bạn thực hiện một hành động, thì ngược lại, bạn đang hỏi điều gì sẽ xảy ra nếu bạn thực hiện một hành động khác trong một tình huống cụ thể , cho rằng bạn có thông tin về những gì thực sự đã xảy ra. Lưu ý rằng, vì bạn đã biết những gì đã xảy ra trong thế giới thực, bạn cần cập nhật thông tin của mình về quá khứ trước những bằng chứng bạn đã quan sát.

Hai loại truy vấn này là khác biệt về mặt toán học vì chúng yêu cầu các mức thông tin khác nhau phải được trả lời (phản tác dụng cần nhiều thông tin hơn để được trả lời) và thậm chí ngôn ngữ phức tạp hơn để được khớp nối!.

Với thông tin cần thiết để trả lời Rung 3 câu hỏi, bạn có thể trả lời Rung 2 câu hỏi, nhưng không phải là cách khác. Chính xác hơn, bạn không thể trả lời các câu hỏi phản tác dụng chỉ bằng thông tin can thiệp. Các ví dụ trong đó xảy ra xung đột giữa các can thiệp và phản tác dụng đã được đưa ra ở đây trong CV, xem bài đăng này và bài đăng này . Tuy nhiên, để hoàn thiện, tôi cũng sẽ đưa ra một ví dụ ở đây.

Ví dụ dưới đây có thể được tìm thấy trong Nhân quả, mục 1.4.4.

Hãy xem xét rằng bạn đã thực hiện một thử nghiệm ngẫu nhiên trong đó bệnh nhân được chỉ định ngẫu nhiên (50% / 50%) cho điều trị ( ) và điều kiện kiểm soát ( ), và trong cả hai nhóm điều trị và kiểm soát đã phục hồi 50% ( ) và 50% đã chết ( ). Đó là . $x =1$ $x=0$ $y=0$ $y=1$ $P(y|x) = 0.5~~~\forall x,y$

Kết quả của thí nghiệm cho bạn biết rằng hiệu quả nhân quả trung bình của can thiệp là bằng không. Đây là một câu hỏi 2 bậc, . $P(Y = 1|do(X = 1)) - P(Y=1|do(X =0) = 0$

Nhưng bây giờ chúng ta hãy đặt câu hỏi sau đây: bao nhiêu phần trăm những bệnh nhân tử vong khi điều trị sẽ hồi phục nếu họ không điều trị? Về mặt toán học, bạn muốn tính . $P(Y_{0} = 0|X =1, Y = 1)$

Câu hỏi này không thể được trả lời chỉ với dữ liệu can thiệp mà bạn có. Bằng chứng rất đơn giản: Tôi có thể tạo hai mô hình nhân quả khác nhau sẽ có cùng các phân phối can thiệp, nhưng các phân phối phản tác dụng khác nhau. Hai được cung cấp dưới đây:

Ở đây, lên đến các yếu tố không quan sát được giải thích cách bệnh nhân phản ứng với điều trị. Bạn có thể nghĩ về các yếu tố giải thích sự không đồng nhất trong điều trị, ví dụ. Lưu ý phân phối biên của cả hai mô hình đồng ý. $U$ $P(y, x)$

Lưu ý rằng, trong mô hình đầu tiên, không ai bị ảnh hưởng bởi việc điều trị, do đó tỷ lệ phần trăm những bệnh nhân tử vong khi điều trị sẽ hồi phục nếu họ không điều trị bằng không.

Tuy nhiên, trong mô hình thứ hai, mọi bệnh nhân đều bị ảnh hưởng bởi việc điều trị và chúng tôi có một hỗn hợp gồm hai quần thể trong đó hiệu ứng nhân quả trung bình hóa ra bằng không. Trong ví dụ này, số lượng phản tác dụng hiện nay lên tới 100% --- trong Mô hình 2, tất cả các bệnh nhân tử vong khi điều trị sẽ hồi phục nếu họ không điều trị.

Do đó, có sự phân biệt rõ ràng của nấc 2 và nấc 3. Như ví dụ cho thấy, bạn không thể trả lời các câu hỏi không chính xác chỉ bằng thông tin và giả định về các can thiệp. Điều này được làm rõ với ba bước để tính toán một phản tác dụng:

Bước 1 (bắt cóc): cập nhật xác suất của các yếu tố không quan sát được theo các bằng chứng quan sát được $P(u)$ $P(u|e)$
Bước 2 (hành động): thực hiện hành động trong mô hình (ví dụ . $do(x))$
Bước 3 (dự đoán): dự đoán trong mô hình đã sửa đổi. $Y$

Điều này sẽ không thể tính toán nếu không có một số thông tin chức năng về mô hình nguyên nhân hoặc không có một số thông tin về các biến tiềm ẩn.

— Carlos Cinelli
nguồn

Câu trả lời thú vị! Một vài câu hỏi tiếp theo: 1) Bạn nói " Với thông tin Rung 3, bạn có thể trả lời Rung 2 câu hỏi, nhưng không phải là cách khác ". Nhưng trong ví dụ về việc hút thuốc của bạn, tôi không hiểu làm thế nào để biết Joe có khỏe mạnh không nếu anh ta chưa bao giờ hút thuốc trả lời câu hỏi 'Anh ta có khỏe không nếu anh ta bỏ thuốc vào ngày mai sau 30 năm hút thuốc'. Chúng có vẻ giống như những câu hỏi riêng biệt, vì vậy tôi nghĩ rằng tôi đang thiếu một cái gì đó.

— mkt - Tái lập Monica

Ngoài ra, ví dụ làm việc tiếp theo của bạn phụ thuộc vào 2 biến không quan sát được phân phối không hợp lý giữa điều trị và kiểm soát. Nhưng bạn đã mô tả đây là một thử nghiệm ngẫu nhiên - vì vậy đây không phải là trường hợp ngẫu nhiên xấu? Với sự ngẫu nhiên thích hợp, tôi không thấy làm thế nào bạn có được hai kết quả khác nhau như vậy trừ khi tôi thiếu một cái gì đó cơ bản.

— mkt - Tái lập Monica

@mkt từ cuối đến trước. Biến không quan sát được phân bổ ngẫu nhiên giữa điều trị và kiểm soát, bạn có chính xác 50% của mỗi loại u trong cả hai nhánh. Theo thông tin, chúng tôi có nghĩa là đặc điểm kỹ thuật một phần của mô hình cần thiết để trả lời các truy vấn không chính xác nói chung, không phải là câu trả lời cho một truy vấn cụ thể. Để trả lời các truy vấn không chính xác, bạn cần cấu trúc nhân quả + một số thông tin chức năng hoặc thông tin về phân phối các biến tiềm ẩn.

— Carlos Cinelli

0

Dưới đây là câu trả lời mà Judea Pearl đưa ra trên twitter :

Bạn đọc hỏi: Tại sao can thiệp (Rung-2) khác với phản tác dụng (Rung-3)? Không can thiệp phủ nhận một số khía cạnh của thế giới quan sát?

Ans. Các can thiệp thay đổi nhưng không mâu thuẫn với thế giới quan sát được, bởi vì thế giới trước và sau can thiệp đòi hỏi các biến số khác biệt theo thời gian. Ngược lại, "Tôi đã chết" mâu thuẫn với những sự thật đã biết. Đối với một cuộc thảo luận gần đây, xem cuộc thảo luận này .

Ghi chú: Cả nhóm #causalinference của Harvard và khung kết quả tiềm năng của Rubin không phân biệt Rung-2 với Rung-3.

Điều này, tôi tin rằng, là một kháng chiến bắt nguồn từ văn hóa sẽ được khắc phục trong tương lai. Nó bắt nguồn từ nguồn gốc của cả hai khung trong ẩn dụ "như thể ngẫu nhiên", trái ngược với ẩn dụ "lắng nghe" vật lý của #Bookofwhy

— Benjamin Crouzier
nguồn