Hiểu lý thuyết phân tách d trong các mạng Bayes nhân quả


15

Tôi đang cố gắng để hiểu logic phân tách d trong Mạng lưới quan hệ nhân quả. Tôi biết thuật toán hoạt động như thế nào, nhưng tôi không hiểu chính xác lý do tại sao "luồng thông tin" hoạt động như đã nêu trong thuật toán.

nhập mô tả hình ảnh ở đây

Ví dụ trong biểu đồ trên, hãy nghĩ rằng chúng ta chỉ được cung cấp X và không có biến nào khác được quan sát. Sau đó, theo quy tắc phân tách d, luồng thông tin từ X đến D:

  1. X ảnh hưởng đến A, đó là . Điều này không sao, vì A gây ra X và nếu chúng ta biết về hiệu ứng X, điều này ảnh hưởng đến niềm tin của chúng ta về nguyên nhân A. Luồng thông tin.P(A)P(A|X)

  2. X ảnh hưởng đến B, đó là . Điều này là ổn, vì A đã được thay đổi bởi kiến ​​thức của chúng tôi về X, sự thay đổi tại A có thể ảnh hưởng đến niềm tin của chúng tôi về nguyên nhân của nó, B, cũng vậy.P(B)P(B|X)

  3. X ảnh hưởng đến C, đó là . Điều này là ổn vì chúng ta biết rằng B bị thiên vị bởi kiến ​​thức của chúng ta về tác động gián tiếp của nó, X và vì B bị sai lệch bởi X, nên điều này sẽ ảnh hưởng đến tất cả các tác động trực tiếp và gián tiếp của B. C là một tác động trực tiếp của B và nó bị ảnh hưởng bởi kiến ​​thức của chúng tôi về X.P(C)P(C|X)

Chà, cho đến thời điểm này, mọi thứ đều ổn đối với tôi vì luồng thông tin xảy ra theo các mối quan hệ nguyên nhân trực quan. Nhưng tôi không có hành vi đặc biệt của cái gọi là "Cấu trúc V" hay "Máy va chạm" trong sơ đồ này. Theo lý thuyết phân tách d, B và D là nguyên nhân phổ biến của C trong biểu đồ trên và nó nói rằng nếu chúng ta không quan sát C hoặc bất kỳ hậu duệ nào của nó, thông tin dòng chảy từ X bị chặn tại C. Chà, OK , nhưng câu hỏi của tôi là tại sao?

Từ ba bước trên, bắt đầu từ X, chúng tôi thấy rằng C bị ảnh hưởng bởi kiến ​​thức của chúng tôi về X và luồng thông tin xảy ra theo mối quan hệ nguyên nhân. Lý thuyết phân tách d nói rằng chúng ta không thể đi từ C đến D vì C không được quan sát. Nhưng tôi nghĩ rằng vì chúng ta biết rằng C sai lệch và D là nguyên nhân của C, D cũng bị ảnh hưởng trong khi lý thuyết nói ngược lại. Tôi rõ ràng đang thiếu một cái gì đó trong mô hình suy nghĩ của mình nhưng không thể thấy nó là gì.

Vì vậy, tôi cần một lời giải thích tại sao luồng thông tin bị chặn tại C, nếu C không được quan sát.


Nó không chảy từ X đến D, nếu chỉ quan sát X. Bạn nêu nó ngay bên dưới bức tranh. (Mặc dù bạn mô tả chính xác nó xuống hơn nữa).
ziggystar

Tôi đã biết điều này rồi, luồng thông tin bị chặn tại C nơi chúng tôi có "Cấu trúc V". Điều tôi muốn biết là tại sao; tại sao Cấu trúc V chặn luồng thông tin khi chúng ta không quan sát C, từ quan điểm nguyên nhân - quan điểm.
Ufuk Can bicici

Câu trả lời:


6

Có phải là không trực quan mà bạn không thể lý do từ nguyên nhân đến hiệu quả không quan sát đến nguyên nhân khác? Nếu mưa (B) và vòi phun nước (D) là nguyên nhân gây ra mặt đất ẩm ướt (C), thì bạn có thể lập luận rằng nhìn thấy mưa ngụ ý rằng mặt đất có thể ướt, và tiếp tục lý do rằng vòi phun nước phải ở trên mặt đất ướt?! Dĩ nhiên là không. Bạn lập luận rằng mặt đất ẩm ướt vì mưa - bạn không thể tìm kiếm thêm nguyên nhân!

Nếu bạn quan sát mặt đất ẩm ướt, tất nhiên tình hình thay đổi. Bây giờ bạn có thể có thể suy luận từ nguyên nhân này sang nguyên nhân khác như Frank giải thích.


4

Hãy tạm quên X và xem xét chỉ là máy va chạm của B, C và D. Lý do cấu trúc v có thể chặn đường đi giữa B và D là, nói chung, nếu bạn có hai biến ngẫu nhiên độc lập (B và D) ảnh hưởng đến cùng một kết quả (C), sau đó biết kết quả có thể cho phép bạn đưa ra kết luận về mối quan hệ giữa các biến ngẫu nhiên, do đó cho phép luồng thông tin.

P(B|D)P(B)P(D|B)P(D)). Do đó, biết rằng bãi cỏ ẩm ướt làm tắc nghẽn đường đi và làm cho B và D phụ thuộc.

Để hiểu rõ hơn về điều này, có thể hữu ích khi xem qua Nghịch lý của Berkson , mô tả tình huống tương tự.


1) Tôi gặp khó khăn trong việc tìm hiểu nguyên nhân độc lập là gì trước khi xác định bất cứ điều gì về Phân tách D. Nhiều tác giả định nghĩa Phân tách D bằng cách sử dụng các mối quan hệ nguyên nhân trực quan. Tôi cố gắng xây dựng một hệ thống lý luận dựa trên những gì tôi đang đọc từ các nguồn khác nhau và dựa trên trực giác của tôi để tôi có thể đi đến thỏa thuận với Định lý này. Nó giống như sau: "Nếu không có biến nào được quan sát ngoài X, thì kiến ​​thức về X có thể ảnh hưởng đến hiệu ứng của X (tất cả con cháu), nguyên nhân trực tiếp hoặc gián tiếp của X (tổ tiên) và tất cả các tác động khác của nguyên nhân X."
Ufuk Can bicici

2) Tôi biện minh cho suy nghĩ này như thế: A) X có thể ảnh hưởng đến các tác động trực tiếp và gián tiếp của nó, rõ ràng, vì các giá trị X khác nhau sẽ tạo ra các nguyên nhân khác nhau. B) X có thể ảnh hưởng đến các nguyên nhân trực tiếp và gián tiếp của nó vì nếu chúng ta quan sát thấy một hiệu ứng, chúng ta có thể có được thông tin mới về các nguyên nhân, theo cách tiếp cận chẩn đoán. C) X ảnh hưởng đến các tác động khác (không bao gồm chính nó) của tất cả các nguyên nhân trực tiếp và gián tiếp của nó, vì kiến ​​thức về X đã thay đổi niềm tin của chúng ta về những nguyên nhân này từ đó ảnh hưởng đến tất cả các tác động. Tôi cố gắng diễn giải Mạng lưới nhân quả như vậy với mẫu này. Điều này có đúng không khi bắt đầu?
Ufuk Can bicici

3) Giống như tôi đang cố gắng hình thành một mẫu "Luồng thông tin" trực quan để hiểu các hành vi phụ thuộc độc lập của các biến. Với mô hình này, tôi không thể thấy nguyên nhân độc lập là gì và đây là nơi tôi bị mắc kẹt. Rõ ràng tôi bỏ lỡ điều gì đó hoặc tôi có thể hoàn toàn sai với mô hình suy nghĩ này.
Ufuk Can bicici

Tôi nghĩ rằng câu trả lời ban đầu của tôi hơi sai lệch, vì tôi gọi B và D là "nguyên nhân" (đã được sửa bây giờ). Luồng thông tin là một khái niệm được liên kết với các quan sát, không phải là sự can thiệp nguyên nhân. Như bạn đã biết, hai biến ngẫu nhiên là độc lập nếu việc quan sát một biến cho bạn không có thông tin nào về biến thứ hai. Báo cáo của bạn dường như kết hợp quan sát và suy luận. Quan sát X cho phép chúng ta điều chỉnh suy luận của cha mẹ (câu A) và nguyên nhân trực tiếp của nó, nhưng nếu cấu trúc v chặn đường đi, thì chúng ta không thể điều chỉnh suy luận cho các nguyên nhân gián tiếp, vì các lý do được mô tả ở trên.
FrankD

1

Chà, cho đến thời điểm này, mọi thứ đều ổn đối với tôi vì luồng thông tin xảy ra theo các mối quan hệ nguyên nhân trực quan. Nhưng tôi không có hành vi đặc biệt của cái gọi là "Cấu trúc V" hay "Máy va chạm" trong sơ đồ này.

Sau đó, hạt cứng để crack ở đây là cấu trúc v. Tôi muốn minh họa sự khác biệt giữa xác suất của biến S chỉ dựa trên quan sát hiệu ứngảnh hưởng của việc quan sát biến D khác độc lập với S trong cùng một tình huống bằng cách sử dụng một ví dụ giả tưởng.

Hãy nói rằng ai đó đang tham gia một khóa học, nói đại số tuyến tính. Nếu anh ta có thể vượt qua nó chủ yếu phụ thuộc vào độ khó của kỳ thi. Hãy biểu thị sự kiện vượt qua khóa học bằng P, chuyển qua 1 và 0 nếu không; và độ khó của bài kiểm tra là D, khó là 1 và dễ là 0. Và điều gì đó vô nghĩa cũng có thể ảnh hưởng đến hiệu suất của anh ta hoặc kết quả, giả sử điểm kỳ dị xảy ra và anh ta sẽ bị tẩy não bằng máy và sau đó quyết định không làm bải kiểm tra. Chúng tôi biểu thị sự kiện đó bằng S và xác suất của nó là 0,0001. Điều đó dường như là không thể nhưng theo định nghĩa thì cơ hội của nó không nên bằng không.

Do đó, chúng ta có một biểu đồ của dạng cấu trúc v bây giờ:

 D   S
  | |
 \| |/ 
   P  

P(¬P|S)= =0,99999999P(P|S)= =0,000001

| d0   | d1      |      
|:-----|--------:|   
| 0.5  | 0.5     |  

| s0     | s1      |      
|:-------|--------:|   
| 0.9999 | 0.0001  |

| S     | D    | P(p0|S,D) | P(p1|S,D) |  
|:------|-----:|----------:|----------:|
|s0     | d0   |   0.20    |   0.80    |
|s0     | d1   |   0.90    |   0.10    |
|s1     | d0   |   0.999999|   0.000001|
|s1     | d1   |   0.999999|   0.000001| 

P(S|P)P(S|P,D)

1) Nếu chúng ta không biết kết quả, chúng ta có thể tính xác suất của điểm kỳ dị xảy ra trong khóa học là dễ dàng.

P(S|¬D)=P(S,P|¬D)+P(S,¬P|¬D)=P(S=1,P=1,D=0)P(D=0)+P(S=1,P=0,D=0)P(D=0)=P(S=1)P(D=0|S=1)P(P=1|D=0,S=1)P(D=0)+P(S=1)P(D=0|S=1)P(P=0|D=0,S=1)P(D=0)=P(S=1)P(D=0|S=1)P(D= =0)= =P(S= =1)P(D= =0)P(D= =0)= =P(S= =1)= =0,0001

Như bạn có thể thấy ở trên không có vấn đề gì nếu kỳ thi được thông qua hay không. Điều gì đến như nó sẽ đến. Nó có thể được coi là một xác suất cận biên so với P.

Và chúng ta cũng có thể tìm ra xác suất điểm kỳ dị xảy ra khi học sinh không vượt qua bài kiểm tra:

P(S,|¬P)=P(S,¬P)P(¬P)=P(S,¬p,D)+P(S,¬P,¬D)P(¬P)=P(¬P|S,D)P(S)P(D)+P(¬P|S,¬D)P(S)P(¬D)S,DP(¬P|S,D)P(S)P(D)=0.0001818

Knowing that the guy doesn't pass the exam we can guess that he may be brainwashed by a machine is 0.0001818 which is a little bigger than when we don't know it.

2) But what if we know that the guy failed the exam and the exam is easy?

P(S,|¬P,¬D)=P(S=1,P=0,D=0)P(P=0,D=0)=P(P=0|S=1,D=0)P(S=1)P(D=0)P(P=0|S=1,D=0)P(S=1)P(D=0)+P(P=0|S=0,D=0)P(S=0)P(D=0)=0.999999×0.0001×0.50.2×0.9999×0.5+0.999999×0.0001×0.5=0.0004998

Lo and behold, the change is much bigger than we just know he doesn't plass the exam. Then we see that P(S|P)P(S|P,D) we can infer that SD|PI(P(P,S,D)) which means D can influence S via P.

May this detailed derivation be of hlep.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.