Là hướng của các cạnh trong Mạng Bayes không liên quan?


10

Hôm nay, trong một bài giảng, người ta đã tuyên bố rằng hướng của các cạnh trong mạng Bayes không thực sự quan trọng. Họ không phải đại diện cho quan hệ nhân quả.

Rõ ràng là bạn không thể chuyển đổi bất kỳ cạnh nào trong mạng Bayes. Ví dụ: đặt với và . Nếu bạn chuyển sang , thì sẽ không còn mang tính chu kỳ và do đó không phải là mạng Bayes. Đây dường như chủ yếu là một vấn đề thực tế làm thế nào để ước tính xác suất sau đó. Trường hợp này có vẻ khó trả lời hơn nhiều, vì vậy tôi sẽ bỏ qua nó.V = { v 1 , v 2 , v 3 } E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } ( v 1 , v 3 ) ( v 3 , v 1 ) GG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Điều này khiến tôi hỏi những câu hỏi sau mà tôi hy vọng sẽ có câu trả lời ở đây:

  1. Có thể cho bất kỳ đồ thị chu kỳ có hướng (DAG) nào có thể đảo ngược tất cả các cạnh mà vẫn có DAG không?
  2. Giả sử DAG và dữ liệu được đưa ra. Bây giờ chúng tôi xây dựng DAG nghịch đảo . Đối với cả hai DAG, chúng tôi điều chỉnh dữ liệu cho các mạng Bayes tương ứng. Bây giờ chúng tôi có một bộ dữ liệu mà chúng tôi muốn sử dụng mạng Bayes để dự đoán các thuộc tính bị thiếu. Có thể có kết quả khác nhau cho cả hai DAG? (Tiền thưởng nếu bạn đưa ra một ví dụ)G invGGinv
  3. Tương tự như 2, nhưng đơn giản hơn: Giả sử DAG và dữ liệu được cung cấp. Bạn có thể tạo một biểu đồ mới bằng cách đảo ngược bất kỳ tập hợp các cạnh nào, miễn là vẫn theo chu kỳ. Các mạng Bayes có tương đương khi nói đến dự đoán của họ không?G ' G 'GGG
  4. Chúng ta có nhận được một cái gì đó nếu chúng ta có các cạnh đại diện cho quan hệ nhân quả không?

Câu trả lời:


6

TL; DR: đôi khi bạn có thể tạo một mạng Bayes tương đương bằng cách đảo ngược mũi tên và đôi khi bạn không thể.

Chỉ cần đảo ngược hướng mũi tên sẽ tạo ra một đồ thị có hướng khác, nhưng đồ thị đó không nhất thiết là đồ thị của mạng Bayes tương đương, bởi vì các quan hệ phụ thuộc được biểu thị bằng đồ thị mũi tên đảo ngược có thể khác với đồ thị được biểu thị bằng biểu đồ gốc. Nếu biểu đồ mũi tên đảo ngược biểu thị các quan hệ phụ thuộc khác với bản gốc, trong một số trường hợp, có thể tạo một mạng Bayes tương đương bằng cách thêm một số mũi tên khác để nắm bắt các quan hệ phụ thuộc bị thiếu trong biểu đồ mũi tên đảo ngược. Nhưng trong một số trường hợp không có một mạng Bayes tương đương chính xác. Nếu bạn phải thêm một số mũi tên để chụp phụ thuộc,

Ví dụ, a -> b -> cđại diện cho các phụ thuộc và độc lập tương tự như a <- b <- c, và giống như a <- b -> c, nhưng không giống như a -> b <- c. Biểu đồ cuối cùng này nói rằng acđộc lập nếu bkhông được quan sát, nhưng a <- b -> cnói acphụ thuộc trong trường hợp đó. Chúng ta có thể thêm một cạnh trực tiếp từ ađể cnắm bắt điều đó, nhưng sau đó acđộc lập khi bđược quan sát không được biểu diễn. Điều đó có nghĩa là có ít nhất một yếu tố mà chúng ta không thể khai thác khi tính toán xác suất sau.

Tất cả những thứ này về sự phụ thuộc / độc lập, mũi tên và sự đảo ngược của chúng, v.v., được đề cập trong các văn bản tiêu chuẩn trên các mạng Bayes. Tôi có thể khai thác một số tài liệu tham khảo nếu bạn muốn.

Mạng Bayes không thể hiện quan hệ nhân quả. Judea Pearl, người đã làm rất nhiều công việc trên các mạng Bayes, cũng đã làm việc trên cái mà ông gọi là mạng nhân quả (về cơ bản là các mạng Bayes có chú thích với quan hệ nhân quả).


Điều này trả lời các câu hỏi (2) và (3). Bạn có ý tưởng về câu hỏi (1) và (4) không? (Vâng, tài liệu tham khảo sẽ rất hay)
Martin Thoma

(1) Xem xét tính tương phản: nếu đồ thị mũi tên đảo ngược có chu kỳ được định hướng, thì theo các mũi tên xung quanh chu kỳ ngược phải là một chu kỳ có hướng trong biểu đồ ban đầu. (4) Mạng Bayes là mô hình xác suất và như vậy không đại diện cho quan hệ nhân quả. Có thể một số mũi tên thực sự đề cập đến mối quan hệ nhân quả, nhưng điều này bị mất trong một mô hình xác suất. Có thể anguyên nhân b, nhưng a -> ba <- blà mô hình xác suất hợp lệ như nhau.
Robert Dodier

Một số tài liệu tham khảo giới thiệu. Koller & Friedman: "Mô hình đồ họa xác suất". Cowell, Dawid, Lauritzen và Spiegelhalter: "Mạng xác suất và hệ thống chuyên gia". Castillo, Gutierrez và Hadi: "Hệ thống chuyên gia và mô hình mạng xác suất".
Robert Dodier

Bạn có thể đảo ngược bất kỳ mũi tên nào và nhận được Mạng Bayes tương đương miễn là bạn giữ cấu trúc v (không đảo ngược một mũi tên mà một mũi tên khác cũng đang chỉ vào nút mà nó đang trỏ)
borgr

1

Điều này có thể hơi không thỏa mãn, vì vậy hãy thoải mái không chấp nhận câu trả lời này và xin lỗi trước.

Trong mạng Bayes, các nút đại diện cho các biến ngẫu nhiên và các cạnh thể hiện sự phụ thuộc có điều kiện. Khi bạn diễn giải các nút theo một cách nhất định, điều hòa chảy theo một cách nhất định một cách tự nhiên. Tự ý đảo ngược chúng không thực sự có ý nghĩa trong bối cảnh mô hình hóa dữ liệu. Và rất nhiều thời gian, các mũi tên đại diện cho nhân quả.


1
Điều này là khá xa khỏi nhãn hiệu. Giải thích "tự nhiên" là một cái gì đó áp đặt cho mô hình, nó không phải là một phần của chính mô hình. Bạn có thể đảo ngược các phụ thuộc (thêm các cạnh bổ sung nếu cần để duy trì tập hợp các phụ thuộc được đại diện bởi mạng) và đó vẫn là một mạng Bayes. Cho dù nó có ý nghĩa không thể trả lời bằng cách chỉ kiểm tra mạng. Ngẫu nhiên Judea Pearl, một trong những động lực lớn đằng sau các mạng Bayes trong thập niên 80 và 90, gần đây đã làm việc trên các mô hình chính thức cho quan hệ nhân quả, thể hiện mối quan hệ nhân quả trong mô hình.
Robert Dodier

Bạn nói, "liệu nó có ý nghĩa không thể trả lời được bằng cách kiểm tra chính mạng đó." Tôi chưa bao giờ nói nó được. Tôi đã nói "khi bạn diễn giải các nút theo một cách nhất định, điều hòa chảy theo một cách nhất định ..." Điều này có thể phản ánh sự thiên vị của tôi; bạn có thể gọi những thứ tôi làm việc trên mạng bayes, nhưng câu hỏi này sẽ không bao giờ xảy ra với tôi. Ví dụ, nếu hai nút đại diện cho cùng một biến tại các thời điểm khác nhau, sẽ không có câu hỏi nào về hướng điều hòa chảy. Tuy nhiên, tôi chấp nhận khả năng rằng có những tình huống mà mọi người có thể sử dụng các lưới này của Baye theo cách ít cứng nhắc hơn.
Taylor

0

Câu 3

synergy.st-andrews.ac.uk/vannesmithlab tuyên bố rằng các biểu đồ

G1 = o->o->o and
G2 = o<-o->o

là trong một lớp tương đương. Theo nguồn đó, các mô hình đại diện chính xác phân phối xác suất chung.


Điều đó không thể đúng. Đối với G1, đầu tiên và cuối cùng phụ thuộc vào việc không có bất kỳ giá trị đã biết nào. Đối với G2, đầu tiên và cuối cùng không phụ thuộc vào việc không có bất kỳ giá trị đã biết nào. Ý của bạn là viết G2 = o <- o -> o? Dù sao, tôi không thấy một tuyên bố về những biểu đồ cụ thể trên trang web mà bạn đã tham chiếu; có lẽ bạn có thể được cụ thể hơn.
Robert Dodier
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.