Sự khác biệt giữa mạng Bayes (động) và HMM là gì?

Tôi đã đọc được rằng các HMM, Bộ lọc hạt và bộ lọc Kalman là những trường hợp đặc biệt của mạng Bayes động. Tuy nhiên, tôi chỉ biết HMM và tôi không thấy sự khác biệt đối với các mạng Bayes động.

Ai đó có thể vui lòng giải thích?

Sẽ thật tuyệt nếu câu trả lời của bạn có thể tương tự như sau, nhưng đối với Bayes Networks:

Mô hình Markov ẩn

Mô hình Markov ẩn (HMM) là 5-tuple : $\lambda = (S, O, A, B, \Pi)$

$S \neq \emptyset$ : Một tập hợp các trạng thái (ví dụ: "bắt đầu âm vị", "giữa âm vị", "kết thúc âm vị")
: Một tập hợp các quan sát có thể (tín hiệu âm thanh) $O \neq \emptyset$
: Một ma trận ngẫu nhiên cung cấp xác suất để chuyển từ trạng thái sang trạng thái . $A \in \mathbb{R}^{|S| \times |S|}$ $(a_{ij})$ $i$ $j$
: Một ma trận ngẫu nhiên cung cấp xác suất để có được trạng thái quan sát . $B \in \mathbb{R}^{|S| \times |O|}$ $(b_{kl})$ $k$ $l$
: Phân phối ban đầu để bắt đầu ở một trong các tiểu bang. $\Pi \in \mathbb{R}^{|S|}$

Nó thường được hiển thị dưới dạng biểu đồ có hướng, trong đó mỗi nút tương ứng với một trạng thái và xác suất chuyển tiếp được biểu thị trên các cạnh. $s \in S$

Các mô hình Markov ẩn được gọi là "ẩn", vì trạng thái hiện tại bị ẩn. Các thuật toán phải đoán nó từ các quan sát và mô hình chính nó. Chúng được gọi là "Markov", bởi vì đối với trạng thái tiếp theo chỉ có trạng thái hiện tại.

Đối với HMM, bạn đưa ra một cấu trúc liên kết cố định (số trạng thái, các cạnh có thể). Sau đó, có 3 nhiệm vụ có thể

Đánh giá : đưa ra HMM , khả năng nhận được các quan sát (Thuật toán chuyển tiếp) $\lambda$ $o_1, \dots, o_t$
Giải mã : cho một HMM và quan sát , các khả năng trình tự nhất của các quốc gia là những gì (thuật toán Viterbi) $\lambda$ $o_1, \dots, o_t$ $s_1, \dots, s_t$
Học : tìm hiểu : Baum-Welch thuật toán , mà là một trường hợp đặc biệt của Kỳ vọng tối đa hóa. $A, B, \Pi$

Mạng Bayes

Mạng Bayes là đồ thị chu kỳ theo hướng (DAG) . Các nút đại diện cho các biến ngẫu nhiên . Đối với mỗi , có một phân phối xác suất dựa trên cha mẹ của : $G = (\mathcal{X}, \mathcal{E})$ $X \in \mathcal{X}$ $X$ $X$

P (X | parents (X))

$P(X|\text{parents}(X))$

Dường như có (xin làm rõ) hai nhiệm vụ:

Suy luận : Đưa ra một số biến, nhận các giá trị rất có thể của các biến khác. Suy luận chính xác là NP-cứng. Khoảng, bạn có thể sử dụng MCMC.
Học tập : Cách bạn học các phân phối đó phụ thuộc vào vấn đề chính xác ( nguồn ):
- cấu trúc đã biết, hoàn toàn có thể quan sát: ước tính khả năng tối đa (MLE)
- cấu trúc đã biết, có thể quan sát được một phần: Tối đa hóa kỳ vọng (EM) hoặc Markov Chain Monte Carlo (MCMC)
- cấu trúc không xác định, hoàn toàn có thể quan sát: tìm kiếm thông qua không gian mô hình
- cấu trúc không xác định, có thể quan sát được một phần: EM + tìm kiếm trong không gian mô hình

Mạng Dynamic Bayes

Tôi đoán các mạng Bayes động (DBN) cũng là các mô hình đồ họa xác suất được định hướng. Sự thay đổi dường như đến từ mạng thay đổi theo thời gian. Tuy nhiên, dường như điều này tương đương với việc chỉ sao chép cùng một mạng và kết nối mọi nút tại thời điểm với mọi nút tương ứng tại thời điểm . Có phải vậy không? $t$ $t+1$

bayesian-networks pgm

— Martin Thoma
nguồn

1. Bạn cũng có thể tìm hiểu cấu trúc liên kết của HMM. 2. Khi thực hiện suy luận với BN, ngoài việc yêu cầu ước tính khả năng tối đa, bạn cũng có thể lấy mẫu từ các bản phân phối, ước tính xác suất hoặc làm bất kỳ lý thuyết xác suất nào khác cho phép bạn. 3. Một DBN chỉ là một BN được sao chép theo thời gian, với một số nút (không nhất thiết là tất cả) được xâu chuỗi từ quá khứ đến tương lai. Theo nghĩa này, HMM là một DBN đơn giản chỉ có hai nút trong mỗi lát cắt thời gian và một trong các nút bị xiềng xích theo thời gian.

— KT.

Tôi đã hỏi ai đó về điều này và họ nói: "HMM chỉ là trường hợp đặc biệt của lưới Bayes động, với mỗi lát thời gian chứa một biến tiềm ẩn, phụ thuộc vào biến trước đó để đưa ra chuỗi Markov và một quan sát phụ thuộc vào từng biến tiềm ẩn. có thể có bất kỳ cấu trúc nào phát triển theo thời gian. "

— ashley

Từ một câu hỏi Xác thực chéo tương tự sau câu trả lời @jerad :

Các HMM không tương đương với các DBN, thay vào đó chúng là một trường hợp đặc biệt của các DBN trong đó toàn bộ trạng thái của thế giới được biểu thị bằng một biến trạng thái ẩn duy nhất. Các mô hình khác trong khung DBN tổng quát hóa HMM cơ bản, cho phép các biến trạng thái ẩn hơn (xem bài viết thứ hai ở trên để biết nhiều loại).

Cuối cùng, không, DBN không phải lúc nào cũng rời rạc. Ví dụ, các mô hình trạng thái Gaussian tuyến tính (Bộ lọc Kalman) có thể được hình thành dưới dạng HMM có giá trị liên tục, thường được sử dụng để theo dõi các đối tượng trong không gian.

Tôi khuyên bạn nên xem qua hai bài đánh giá xuất sắc này:

Giới thiệu về Mô hình Markov ẩn và Mạng Bayes của Zoubin Gharamani

Mạng Bayes năng động của Kevin Murphy

— xboard
nguồn