Tôi đã đọc được rằng các HMM, Bộ lọc hạt và bộ lọc Kalman là những trường hợp đặc biệt của mạng Bayes động. Tuy nhiên, tôi chỉ biết HMM và tôi không thấy sự khác biệt đối với các mạng Bayes động.
Ai đó có thể vui lòng giải thích?
Sẽ thật tuyệt nếu câu trả lời của bạn có thể tương tự như sau, nhưng đối với Bayes Networks:
Mô hình Markov ẩn
Mô hình Markov ẩn (HMM) là 5-tuple :
- : Một tập hợp các trạng thái (ví dụ: "bắt đầu âm vị", "giữa âm vị", "kết thúc âm vị")
- : Một tập hợp các quan sát có thể (tín hiệu âm thanh)
- : Một ma trận ngẫu nhiên cung cấp xác suất ( a i j ) để chuyển từ trạng thái i sang trạng thái j .
- : Một ma trận ngẫu nhiên cung cấp xác suất ( b k l ) để có được trạng thái k quan sát l .
- : Phân phối ban đầu để bắt đầu ở một trong các tiểu bang.
Nó thường được hiển thị dưới dạng biểu đồ có hướng, trong đó mỗi nút tương ứng với một trạng thái và xác suất chuyển tiếp được biểu thị trên các cạnh.
Các mô hình Markov ẩn được gọi là "ẩn", vì trạng thái hiện tại bị ẩn. Các thuật toán phải đoán nó từ các quan sát và mô hình chính nó. Chúng được gọi là "Markov", bởi vì đối với trạng thái tiếp theo chỉ có trạng thái hiện tại.
Đối với HMM, bạn đưa ra một cấu trúc liên kết cố định (số trạng thái, các cạnh có thể). Sau đó, có 3 nhiệm vụ có thể
- Đánh giá : đưa ra HMM , khả năng nhận được các quan sát o 1 , Mạnh , o t (Thuật toán chuyển tiếp)
- Giải mã : cho một HMM và quan sát o 1 , ... , o t , các khả năng trình tự nhất của các quốc gia là những gì s 1 , ... , s t (thuật toán Viterbi)
- Học : tìm hiểu : Baum-Welch thuật toán , mà là một trường hợp đặc biệt của Kỳ vọng tối đa hóa.
Mạng Bayes
Mạng Bayes là đồ thị chu kỳ theo hướng (DAG) . Các nút đại diện cho các biến ngẫu nhiên X ∈ X . Đối với mỗi X , có một phân phối xác suất dựa trên cha mẹ của X :
Dường như có (xin làm rõ) hai nhiệm vụ:
- Suy luận : Đưa ra một số biến, nhận các giá trị rất có thể của các biến khác. Suy luận chính xác là NP-cứng. Khoảng, bạn có thể sử dụng MCMC.
Học tập : Cách bạn học các phân phối đó phụ thuộc vào vấn đề chính xác ( nguồn ):
- cấu trúc đã biết, hoàn toàn có thể quan sát: ước tính khả năng tối đa (MLE)
- cấu trúc đã biết, có thể quan sát được một phần: Tối đa hóa kỳ vọng (EM) hoặc Markov Chain Monte Carlo (MCMC)
- cấu trúc không xác định, hoàn toàn có thể quan sát: tìm kiếm thông qua không gian mô hình
- cấu trúc không xác định, có thể quan sát được một phần: EM + tìm kiếm trong không gian mô hình
Mạng Dynamic Bayes
Tôi đoán các mạng Bayes động (DBN) cũng là các mô hình đồ họa xác suất được định hướng. Sự thay đổi dường như đến từ mạng thay đổi theo thời gian. Tuy nhiên, dường như điều này tương đương với việc chỉ sao chép cùng một mạng và kết nối mọi nút tại thời điểm với mọi nút tương ứng tại thời điểm t + 1 . Có phải vậy không?