Sự khác biệt giữa MLE và Baum Welch khi lắp HMM


9

Trong câu hỏi phổ biến này , câu trả lời nâng cao làm cho MLE và Baum Welch tách biệt trong khớp HMM.

Đối với bài toán huấn luyện, chúng ta có thể sử dụng 3 thuật toán sau: MLE (ước tính khả năng tối đa), đào tạo Viterbi (KHÔNG nhầm lẫn với giải mã Viterbi), Baum Welch = thuật toán tiến lùi

NHƯNG trong Wikipedia , nó nói

Thuật toán BaumTHER Welch sử dụng thuật toán EM nổi tiếng để tìm ước tính khả năng tối đa của các tham số

Vậy, mối quan hệ giữa thuật toán MLE và Baum nhạc Welch là gì?


Nỗ lực của tôi: Mục tiêu của thuật toán BaumTHER Welch là tối đa hóa khả năng, nhưng nó sử dụng thuật toán chuyên dụng (EM) để giải quyết tối ưu hóa. Chúng tôi vẫn có thể tối đa hóa khả năng bằng cách sử dụng các phương pháp khác như độ dốc tốt. Đây là lý do tại sao câu trả lời làm cho hai thuật toán riêng biệt.

Tôi có đúng không và có ai có thể giúp tôi làm rõ không?


1
Trong phạm vi của HMM, MLE được sử dụng trong một kịch bản được giám sát và Baum-Welch trong một kịch bản không được giám sát.
David Batista

Câu trả lời:


3

Tham khảo một trong những câu trả lời (của Masterfool) từ liên kết câu hỏi bạn cung cấp,

Câu trả lời của Morat là sai ở một điểm: Baum-Welch là thuật toán Tối đa hóa Kỳ vọng, được sử dụng để huấn luyện các tham số của HMM. Nó sử dụng thuật toán tiến lùi trong mỗi lần lặp. Thuật toán tiến lùi thực sự chỉ là sự kết hợp giữa thuật toán tiến và lùi: một vượt qua, một vượt qua.

Và tôi đồng ý với câu trả lời của PierreE ở đây, thuật toán Baum nhạc Welch được sử dụng để giải quyết khả năng tối đa trong HHM. Nếu các trạng thái được biết (trình tự được giám sát, được dán nhãn), thì phương pháp tối đa hóa MLE khác được sử dụng (có thể giống như, chỉ cần đếm tần số của mỗi phát xạ và chuyển đổi được quan sát trong dữ liệu đào tạo, xem các slide được cung cấp bởi Franck Dernoncourt).

Trong cài đặt MLE cho HMM, tôi không nghĩ bạn chỉ có thể sử dụng độ dốc giảm dần, vì khả năng (hoặc, khả năng đăng nhập) không có giải pháp dạng đóng và phải được giải quyết lặp đi lặp lại, giống như trường hợp trong mô hình hỗn hợp để sau đó chúng tôi chuyển sang EM. (Xem thêm chi tiết trong Giám mục, sách Nhận dạng mẫu, chương 13.2.1 PG614)


0

Vậy, mối quan hệ giữa thuật toán MLE và Baum nhạc Welch là gì?

Thuật toán tối đa hóa kỳ vọng (EM) là khái quát hơn và thuật toán Baum-Welch chỉ đơn giản là một khởi tạo của nó và EM là một thuật toán lặp để có khả năng tối đa (ML). Sau đó, thuật toán Baum-Welch cũng là một thuật toán lặp để có khả năng tối đa.

Thông thường có ba thuật toán tối ưu hóa để ước tính khả năng tối đa (một cách tiếp cận thường xuyên): 1) giảm độ dốc; 2) Chuỗi Markov Monte Carlo; 3) tối đa hóa kỳ vọng.


-1

Câu hỏi này đã ở đây được vài tháng nhưng câu trả lời này có thể giúp người đọc mới, như một sự bổ sung cho nhận xét của David Batista.

Thuật toán Baulm-Welch (BM) là thuật toán tối đa hóa kỳ vọng để giải quyết ước lượng khả năng tối đa (MLE) để huấn luyện HMM của bạn khi các trạng thái không xác định / ẩn (đào tạo không giám sát).

Nhưng nếu bạn biết các trạng thái, bạn có thể sử dụng phương pháp MLE (sẽ không phải là BM) để khớp mô hình của bạn với dữ liệu / trạng thái của cặp theo kiểu được giám sát.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.