Sự khác biệt giữa các mô hình Markov ẩn và Bộ lọc hạt (và Bộ lọc Kalman)


21

Đây là câu hỏi cũ của tôi

Tôi muốn hỏi liệu ai đó có biết sự khác biệt (nếu có bất kỳ sự khác biệt nào) giữa các mô hình Hidden Markov (HMM) và Bộ lọc hạt (PF) hay không, và do đó, chúng tôi sử dụng thuật toán nào. Tôi là một sinh viên và tôi phải làm một dự án, nhưng trước tiên tôi phải hiểu một số điều.

Vì vậy, theo thư mục, cả hai đều là Mô hình không gian trạng thái , bao gồm các trạng thái ẩn (hoặc tiềm ẩn hoặc không quan sát). Theo Wikipedia (Hidden_Markov_model) “trong HMM, không gian trạng thái của các biến ẩn là rời rạc, trong khi các quan sát có thể rời rạc (thường được tạo từ phân phối phân loại) hoặc liên tục (thường là từ phân phối Gaussian). Các mô hình Markov ẩn cũng có thể được khái quát hóa để cho phép các không gian trạng thái liên tục. Ví dụ về các mô hình như vậy là những mô hình mà quá trình Markov xử lý các biến ẩn là một hệ thống động lực tuyến tính, với mối quan hệ tuyến tính giữa các biến liên quan và trong đó tất cả các biến ẩn và quan sát tuân theo phân phối Gaussian. Trong các trường hợp đơn giản, chẳng hạn như hệ thống động lực tuyến tính vừa được đề cập, suy luận chính xác là có thể điều khiển được (trong trường hợp này, sử dụng bộ lọc Kalman); tuy nhiên, nói chung, suy luận chính xác trong HMM với các biến tiềm ẩn liên tục là không khả thi và phải sử dụng các phương pháp gần đúng,Giáo dục

Nhưng đối với tôi, điều này hơi khó hiểu. Nói một cách đơn giản, điều này có nghĩa là việc làm theo (cũng dựa trên nhiều nghiên cứu mà tôi đã thực hiện):

  • Trong HMM, không gian trạng thái có thể rời rạc hoặc liên tục . Ngoài ra các quan sát có thể là rời rạc hoặc liên tục . Ngoài ra HMM là một hệ thống động lực tuyến tính và Gaussian hoặc không Gaussian.
  • Trong PF, không gian trạng thái có thể rời rạc hoặc liên tục . Ngoài ra các quan sát có thể là rời rạc hoặc liên tục . Nhưng PF là một hệ thống động lực phi tuyến tính (và không phải Gaussian?) (Đó có phải là sự khác biệt của chúng?).
  • Bộ lọc Kalman (cũng giống với tôi như HMM) đang được sử dụng khi chúng ta có hệ thống động lực tuyến tínhGaussian .

Ngoài ra, làm thế nào để tôi biết nên chọn thuật toán nào, bởi vì tất cả chúng đều giống nhau ... Tôi cũng tìm thấy một bài báo (không phải bằng tiếng Anh) nói rằng PF mặc dù có thể có dữ liệu tuyến tính (ví dụ: dữ liệu thô từ động cơ cảm biến trong đó nhận ra một chuyển động), hệ thống động lực có thể là phi tuyến tính. Điều này có thể xảy ra không? Điều này có đúng không? Làm sao?

Để nhận dạng cử chỉ, các nhà nghiên cứu có thể sử dụng HMM hoặc PF, nhưng họ không giải thích lý do tại sao họ chọn từng thuật toán. Có ai biết làm thế nào tôi có thể giúp phân biệt các thuật toán này, để hiểu sự khác biệt của chúng và cách chọn thuật toán tốt nhất không?

Tôi xin lỗi nếu câu hỏi của tôi quá lớn, hoặc một số phần ngây thơ nhưng tôi đã không tìm thấy ở đâu đó một câu trả lời thuyết phục và khoa học. Cảm ơn bạn rất nhiều trước thời gian của bạn!

Đây là câu hỏi MỚI của tôi (theo trợ giúp của @ symugatep Warrior)

Vì vậy, với việc đọc thêm, tôi muốn cập nhật một số phần trong nhận xét trước đây của tôi và để đảm bảo rằng tôi hiểu thêm một chút những gì đang diễn ra.

  • Một lần nữa, nói một cách đơn giản, chiếc ô là các mạng Dynamic Bayes, trong đó các mô hình của không gian HMMtrạng thái được bao gồm (các lớp con) ( http://mlg.eng.cam.ac.uk/zoubin/ con / ikprai.pdf ).
  • Hơn nữa, sự khác biệt ban đầu giữa hai mô hình là, trong HMM, các biến trạng thái ẩn là rời rạc , trong khi các quan sát có thể rời rạc hoặc liên tục . Trong PF, các biến trạng thái ẩn là liên tục (vectơ trạng thái ẩn có giá trị thực) và các quan sát có phân phối Gaussian .
  • Cũng theo @conjugatep Warrior, mỗi mô hình có 3 nhiệm vụ sau: lọc, làm mịn và dự đoán. Trong quá trình lọc, mô hình HMM sử dụng cho các biến trạng thái ẩn riêng biệt, thuật toán Chuyển tiếp, không gian trạng thái sử dụng cho các biến liên tục và hệ thống động tuyến tính của Bộ lọc Kalman, v.v.
  • Tuy nhiên, HMM cũng có thể được khái quát hóa để cho phép các không gian trạng thái liên tục .
  • Với các phần mở rộng này của HMM, hai mô hình dường như giống hệt nhau về mặt khái niệm (vì nó cũng được đề cập trong Mô hình chuyển đổi ẩn Markov vs Mô hình chuyển đổi Markov so với Mô hình không gian nhà nước ...? ).

Tôi nghĩ rằng tôi đang sử dụng thuật ngữ chính xác hơn một chút, nhưng mọi thứ vẫn mờ nhạt đối với tôi. Bất cứ ai có thể giải thích cho tôi sự khác biệt giữa mô hình HMM và mô hình không gian nhà nước là gì?

Bởi vì tôi thực sự không thể tìm được câu trả lời phù hợp với nhu cầu của mình ..

Cảm ơn bạn một lần nữa!


1
Nếu thư viện của trường bạn có cuốn sách này: crcpress.com/Time-Series-Modeling-Computing-and-Inference/, tôi sẽ xem qua nó. Nó làm tốt công việc giải thích cả ba chủ đề mà tôi có thể đề cập đến là ba chủ đề rất khác biệt.

Tôi chỉ kiểm tra rằng thư viện không có cuốn sách này, thật không may .. vì vậy nếu bạn có thể gửi cho tôi những phần mà bạn tin rằng trả lời câu hỏi của tôi hoặc giúp tôi phân biệt những chủ đề này thì thật tuyệt! :)
dùng5584748

Câu trả lời:


15

Sẽ rất hữu ích để phân biệt mô hình với suy luận bạn muốn thực hiện với nó, bởi vì bây giờ thuật ngữ tiêu chuẩn trộn lẫn hai mô hình.

Mô hình là phần mà bạn chỉ định bản chất của: không gian ẩn (rời rạc hoặc liên tục), động lực trạng thái ẩn (tuyến tính hoặc phi tuyến tính) bản chất của các quan sát (điển hình là đa phương thức hoặc Bình thường) và mô hình đo lường kết nối trạng thái ẩn để quan sát. HMM và mô hình không gian trạng thái là hai bộ thông số kỹ thuật mô hình như vậy.

tt

Trong trường hợp trạng thái liên tục, động lực học trạng thái và đo tuyến tính và tất cả nhiễu là Bình thường, Bộ lọc Kalman sẽ thực hiện công việc đó một cách hiệu quả. Tương tự của nó khi trạng thái rời rạc là Thuật toán chuyển tiếp. Trong trường hợp có tính phi chuẩn và / hoặc phi tuyến tính, chúng tôi quay lại các bộ lọc gần đúng. Có các xấp xỉ xác định, ví dụ: Bộ lọc Kalman mở rộng hoặc không tập trung và có các xấp xỉ ngẫu nhiên, được biết đến nhiều nhất là Bộ lọc hạt.

Cảm giác chung dường như là trong sự hiện diện của phi tuyến tính không thể tránh khỏi trong trạng thái hoặc các bộ phận đo lường hoặc phi bình thường trong các quan sát (các tình huống vấn đề phổ biến), người ta cố gắng thoát khỏi xấp xỉ rẻ nhất có thể. Vì vậy, EKF rồi UKF rồi PF.

Tài liệu về bộ lọc Kalman không tập trung thường có một số so sánh các tình huống khi nó có thể hoạt động tốt hơn so với tuyến tính hóa truyền thống của Bộ lọc Kalman mở rộng.

Bộ lọc hạt có tính tổng quát gần như hoàn chỉnh - bất kỳ phi tuyến tính, bất kỳ phân phối nào - nhưng theo kinh nghiệm của tôi, tôi yêu cầu điều chỉnh khá cẩn thận và thường khó sử dụng hơn nhiều so với các loại khác. Tuy nhiên, trong nhiều tình huống, đó là lựa chọn duy nhất.

Về phần đọc thêm: Tôi thích chương trình lọc và làm mịn Bayesian của Särkkä, mặc dù nó khá ngắn gọn. Tác giả làm cho có một bản sao trực tuyến có sẵn cho sử dụng cá nhân. Mặt khác, hầu hết các cuốn sách thời gian không gian trạng thái sẽ bao gồm tài liệu này. Đối với Lọc hạt, có Doucet et al. khối lượng về chủ đề này, nhưng tôi đoán bây giờ nó khá cũ. Có lẽ những người khác sẽ chỉ ra một tài liệu tham khảo mới hơn.


Trước hết cảm ơn bạn rất nhiều vì câu trả lời của bạn. Vui lòng kiểm tra xem tôi đã chỉnh sửa câu hỏi trên để mạch lạc và chính xác hơn với thuật ngữ. Tôi cũng viết lại toàn bộ câu hỏi của tôi.
dùng5584748

Trong phần viết lại của bạn, không hoàn toàn đúng rằng "Trong PF, các biến trạng thái ẩn là liên tục (vectơ trạng thái ẩn có giá trị thực) và các quan sát có phân phối Gaussian." PF là một bộ lọc. Mô hình nó là bộ lọc phải có không gian trạng thái liên tục (với một số cấu trúc Markovian hoặc khác) nhưng không bị giới hạn: bất kỳ phân phối, bất kỳ động lực và bất kỳ quá trình đo lường nào.
liên hợp chiến

Ví dụ, bạn có thể sử dụng PF để lọc mô hình không gian trạng thái Gaussian tuyến tính thông thường. Nó sẽ làm việc tốt Bạn không cần phải vì bộ lọc Kalman là chính xác.
liên hợp chiến

4
"Sự khác biệt giữa mô hình HMM và không gian nhà nước là gì?" Về cơ bản: Theo quy ước, HMM có trạng thái riêng biệt. Cũng theo quy ước, 'mô hình không gian trạng thái' biểu thị những thứ có trạng thái liên tục.
liên hợp chiến

Cảm ơn bạn rất nhiều! Vì vậy, sự khác biệt này được xảy ra theo quy ước (và theo thư mục). Nhưng nói chung, chúng ta có thể chọn bất kỳ mô hình nào chúng ta muốn. Đúng không? Mô hình mà tôi sẽ chọn phụ thuộc vào việc tôi sẽ có kết quả tốt hơn không?
dùng5584748
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.