Bayesian Networks (BN's) là mô hình thế hệ. Giả sử bạn có một bộ các nguyên liệu đầu vào, , và đầu ra Y . BN cho phép bạn tìm hiểu phân phối chung P ( X , Y ) , trái ngược với giả sử hồi quy logistic hoặc Support Vector Machine, mô hình phân phối có điều kiện P ( Y | X ) .XYP( X, Y)P( Y| X)
Học phân phối xác suất chung (mô hình tổng quát) của dữ liệu khó hơn học xác suất có điều kiện (mô hình phân biệt đối xử). Tuy nhiên, trước đây cung cấp một mô hình linh hoạt hơn, nơi bạn có thể chạy các truy vấn như hoặc P ( X 1 | X 2 = A , X 3 = B ) , v.v. Với mô hình phân biệt đối xử, mục tiêu duy nhất của bạn là học P ( Y | X ) .P( X1| Y)P( X1| X2= A , X3= B )P( Y| X)
BN tận dụng DAG để kê đơn phân phối chung. Do đó chúng là mô hình đồ họa.
Ưu điểm:
Khi bạn có nhiều dữ liệu bị thiếu, ví dụ như trong y học, BN có thể rất hiệu quả kể từ khi lập mô hình phân phối chung (tức là sự khẳng định của bạn về cách tạo ra dữ liệu) làm giảm sự phụ thuộc của bạn vào việc có một bộ dữ liệu được quan sát đầy đủ.
Khi bạn muốn mô hình hóa một miền theo cách trực quan minh bạch và cũng nhằm mục đích nắm bắt các mối quan hệ , BN có thể rất mạnh mẽ. Lưu ý rằng giả định quan hệ nhân quả trong BN là mở để tranh luận mặc dù.nguyên nhân → hiệu ứng
Học phân phối chung là một nhiệm vụ khó khăn, mô hình hóa nó cho các biến rời rạc (thông qua việc tính toán các bảng xác suất có điều kiện, tức là CPT) về cơ bản dễ dàng hơn so với việc cố gắng làm tương tự cho các biến liên tục. Vì vậy, BN thực tế phổ biến hơn với các biến rời rạc.
BN không chỉ cho phép suy luận quan sát (như tất cả các mô hình học máy cho phép) mà còn can thiệp nguyên nhân s. Đây là một lợi thế thường bị bỏ qua và bị đánh giá thấp của BN và có liên quan đến lý luận trái ngược.