Khi nào nên sử dụng Bayesian Networks hơn các phương pháp học máy khác?


12

Tôi hy vọng có thể không có câu trả lời dứt khoát cho câu hỏi này. Nhưng tôi đã sử dụng một số thuật toán học máy trong quá khứ và đang cố gắng tìm hiểu về Bayesian Networks. Tôi muốn hiểu trong hoàn cảnh nào, hoặc bạn sẽ chọn sử dụng loại vấn đề nào để sử dụng Mạng Bayesian hơn các phương pháp khác?


3
Đối với tôi Bayesian Networks là một cách để xác định sự độc lập có điều kiện trong một mô hình. Khi bạn đã xác định điều đó, tôi đoán bạn có thể sử dụng các công cụ học tập khác nhau để ước tính các tham số mô hình. Vì vậy, tôi thấy một sự tách biệt rõ ràng giữa việc học tham số và mô hình. Tuy nhiên, tôi không phải là một chuyên gia về vấn đề này để ai đó có thể đi kèm với một câu trả lời tốt hơn.
Luca

Câu trả lời:


7

Bayesian Networks (BN's) là mô hình thế hệ. Giả sử bạn có một bộ các nguyên liệu đầu vào, , và đầu ra Y . BN cho phép bạn tìm hiểu phân phối chung P ( X , Y ) , trái ngược với giả sử hồi quy logistic hoặc Support Vector Machine, mô hình phân phối có điều kiện P ( Y | X ) .XYP(X,Y)P(Y|X)

Học phân phối xác suất chung (mô hình tổng quát) của dữ liệu khó hơn học xác suất có điều kiện (mô hình phân biệt đối xử). Tuy nhiên, trước đây cung cấp một mô hình linh hoạt hơn, nơi bạn có thể chạy các truy vấn như hoặc P ( X 1 | X 2 = A , X 3 = B ) , v.v. Với mô hình phân biệt đối xử, mục tiêu duy nhất của bạn là học P ( Y | X ) .P(X1|Y)P(X1|X2= =Một,X3= =B)P(Y|X)

BN tận dụng DAG để kê đơn phân phối chung. Do đó chúng là mô hình đồ họa.

Ưu điểm:

  1. Khi bạn có nhiều dữ liệu bị thiếu, ví dụ như trong y học, BN có thể rất hiệu quả kể từ khi lập mô hình phân phối chung (tức là sự khẳng định của bạn về cách tạo ra dữ liệu) làm giảm sự phụ thuộc của bạn vào việc có một bộ dữ liệu được quan sát đầy đủ.

  2. Khi bạn muốn mô hình hóa một miền theo cách trực quan minh bạch và cũng nhằm mục đích nắm bắt các mối quan hệ , BN có thể rất mạnh mẽ. Lưu ý rằng giả định quan hệ nhân quả trong BN là mở để tranh luận mặc dù.nguyên nhânhiệu ứng

  3. Học phân phối chung là một nhiệm vụ khó khăn, mô hình hóa nó cho các biến rời rạc (thông qua việc tính toán các bảng xác suất có điều kiện, tức là CPT) về cơ bản dễ dàng hơn so với việc cố gắng làm tương tự cho các biến liên tục. Vì vậy, BN thực tế phổ biến hơn với các biến rời rạc.

  4. BN không chỉ cho phép suy luận quan sát (như tất cả các mô hình học máy cho phép) mà còn can thiệp nguyên nhân s. Đây là một lợi thế thường bị bỏ qua và bị đánh giá thấp của BN và có liên quan đến lý luận trái ngược.


1
Trong lợi thế 1 nơi bạn nói BN có hiệu quả để mô hình hóa dữ liệu với nhiều giá trị bị thiếu, những giá trị bị thiếu này có ảnh hưởng đến việc xác định chính xác tính độc lập trong dữ liệu không?
Hossein

1
P(Y,X1,X2), tùy thuộc vào yếu tố DAG của bạn (đóng gói các giả định độc lập của bạn), bạn có thể không cần X1 nếu X2đã có sẵn, hoặc ngược lại.
Zhubarb

1

Theo kinh nghiệm của tôi, Bayesian Networks hoạt động rất tốt khi có dữ liệu phân loại chiều cao . Chúng đưa ra các mô hình có khả năng diễn giải, mà (đôi khi) hỗ trợ trong việc hiểu ý nghĩa của các biến khác nhau tương tác như thế nào.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.