Đây là câu hỏi cũ của tôi
Tôi muốn hỏi liệu ai đó có biết sự khác biệt (nếu có bất kỳ sự khác biệt nào) giữa các mô hình Hidden Markov (HMM) và Bộ lọc hạt (PF) hay không, và do đó, chúng tôi sử dụng thuật toán nào. Tôi là một sinh viên và tôi phải làm một dự án, nhưng trước tiên tôi phải hiểu một số điều.
Vì vậy, theo thư mục, cả hai đều là Mô hình không gian trạng thái , bao gồm các trạng thái ẩn (hoặc tiềm ẩn hoặc không quan sát). Theo Wikipedia (Hidden_Markov_model) “trong HMM, không gian trạng thái của các biến ẩn là rời rạc, trong khi các quan sát có thể rời rạc (thường được tạo từ phân phối phân loại) hoặc liên tục (thường là từ phân phối Gaussian). Các mô hình Markov ẩn cũng có thể được khái quát hóa để cho phép các không gian trạng thái liên tục. Ví dụ về các mô hình như vậy là những mô hình mà quá trình Markov xử lý các biến ẩn là một hệ thống động lực tuyến tính, với mối quan hệ tuyến tính giữa các biến liên quan và trong đó tất cả các biến ẩn và quan sát tuân theo phân phối Gaussian. Trong các trường hợp đơn giản, chẳng hạn như hệ thống động lực tuyến tính vừa được đề cập, suy luận chính xác là có thể điều khiển được (trong trường hợp này, sử dụng bộ lọc Kalman); tuy nhiên, nói chung, suy luận chính xác trong HMM với các biến tiềm ẩn liên tục là không khả thi và phải sử dụng các phương pháp gần đúng,Giáo dục
Nhưng đối với tôi, điều này hơi khó hiểu. Nói một cách đơn giản, điều này có nghĩa là việc làm theo (cũng dựa trên nhiều nghiên cứu mà tôi đã thực hiện):
- Trong HMM, không gian trạng thái có thể rời rạc hoặc liên tục . Ngoài ra các quan sát có thể là rời rạc hoặc liên tục . Ngoài ra HMM là một hệ thống động lực tuyến tính và Gaussian hoặc không Gaussian.
- Trong PF, không gian trạng thái có thể rời rạc hoặc liên tục . Ngoài ra các quan sát có thể là rời rạc hoặc liên tục . Nhưng PF là một hệ thống động lực phi tuyến tính (và không phải Gaussian?) (Đó có phải là sự khác biệt của chúng?).
- Bộ lọc Kalman (cũng giống với tôi như HMM) đang được sử dụng khi chúng ta có hệ thống động lực tuyến tính và Gaussian .
Ngoài ra, làm thế nào để tôi biết nên chọn thuật toán nào, bởi vì tất cả chúng đều giống nhau ... Tôi cũng tìm thấy một bài báo (không phải bằng tiếng Anh) nói rằng PF mặc dù có thể có dữ liệu tuyến tính (ví dụ: dữ liệu thô từ động cơ cảm biến trong đó nhận ra một chuyển động), hệ thống động lực có thể là phi tuyến tính. Điều này có thể xảy ra không? Điều này có đúng không? Làm sao?
Để nhận dạng cử chỉ, các nhà nghiên cứu có thể sử dụng HMM hoặc PF, nhưng họ không giải thích lý do tại sao họ chọn từng thuật toán. Có ai biết làm thế nào tôi có thể giúp phân biệt các thuật toán này, để hiểu sự khác biệt của chúng và cách chọn thuật toán tốt nhất không?
Tôi xin lỗi nếu câu hỏi của tôi quá lớn, hoặc một số phần ngây thơ nhưng tôi đã không tìm thấy ở đâu đó một câu trả lời thuyết phục và khoa học. Cảm ơn bạn rất nhiều trước thời gian của bạn!
Đây là câu hỏi MỚI của tôi (theo trợ giúp của @ symugatep Warrior)
Vì vậy, với việc đọc thêm, tôi muốn cập nhật một số phần trong nhận xét trước đây của tôi và để đảm bảo rằng tôi hiểu thêm một chút những gì đang diễn ra.
- Một lần nữa, nói một cách đơn giản, chiếc ô là các mạng Dynamic Bayes, trong đó các mô hình của không gian HMM và trạng thái được bao gồm (các lớp con) ( http://mlg.eng.cam.ac.uk/zoubin/ con / ikprai.pdf ).
- Hơn nữa, sự khác biệt ban đầu giữa hai mô hình là, trong HMM, các biến trạng thái ẩn là rời rạc , trong khi các quan sát có thể rời rạc hoặc liên tục . Trong PF, các biến trạng thái ẩn là liên tục (vectơ trạng thái ẩn có giá trị thực) và các quan sát có phân phối Gaussian .
- Cũng theo @conjugatep Warrior, mỗi mô hình có 3 nhiệm vụ sau: lọc, làm mịn và dự đoán. Trong quá trình lọc, mô hình HMM sử dụng cho các biến trạng thái ẩn riêng biệt, thuật toán Chuyển tiếp, không gian trạng thái sử dụng cho các biến liên tục và hệ thống động tuyến tính của Bộ lọc Kalman, v.v.
- Tuy nhiên, HMM cũng có thể được khái quát hóa để cho phép các không gian trạng thái liên tục .
- Với các phần mở rộng này của HMM, hai mô hình dường như giống hệt nhau về mặt khái niệm (vì nó cũng được đề cập trong Mô hình chuyển đổi ẩn Markov vs Mô hình chuyển đổi Markov so với Mô hình không gian nhà nước ...? ).
Tôi nghĩ rằng tôi đang sử dụng thuật ngữ chính xác hơn một chút, nhưng mọi thứ vẫn mờ nhạt đối với tôi. Bất cứ ai có thể giải thích cho tôi sự khác biệt giữa mô hình HMM và mô hình không gian nhà nước là gì?
Bởi vì tôi thực sự không thể tìm được câu trả lời phù hợp với nhu cầu của mình ..
Cảm ơn bạn một lần nữa!