Mô hình Markov ẩn vs Mô hình chuyển đổi Markov vs Mô hình không gian nhà nước?


18

Đối với luận án thạc sĩ của tôi, tôi đang nghiên cứu phát triển một mô hình thống kê cho sự chuyển đổi giữa các trạng thái khác nhau, được xác định bởi trạng thái huyết thanh học. Hiện tại, tôi sẽ không cung cấp quá nhiều chi tiết cho bối cảnh này, vì câu hỏi của tôi mang tính khái quát / lý thuyết hơn. Dù sao, trực giác của tôi là tôi nên sử dụng Mô hình Markov ẩn (HMM); những rắc rối tôi gặp phải khi đi qua các tài liệu và nghiên cứu cơ bản khác cần thiết để hình thành mô hình của tôi là sự nhầm lẫn về thuật ngữ và sự khác biệt chính xác giữa các loại mô hình quy trình ẩn khác nhau. Tôi chỉ biết rất mơ hồ về những gì phân biệt chúng (ví dụ sắp tới). Hơn nữa, dường như với tôi, ít nhất là từ những gì tôi đã thấy trong tài liệu, có một từ vựng rất không chuẩn được xây dựng xung quanh loại mô hình này,

Vì vậy, tôi đã hy vọng mọi người có thể giúp tôi định hướng một số điều khoản này cho tôi. Tôi có một số câu hỏi, nhưng tôi đoán rằng khi một hoặc hai câu trả lời thỏa đáng, phần còn lại sẽ trở nên không tương xứng. Tôi hy vọng điều này không quá dài dòng; Nếu một người điều hành muốn tôi chia nó thành nhiều bài tôi sẽ làm. Trong mọi trường hợp, tôi đã đặt câu hỏi của mình in đậm, tiếp theo là các chi tiết của câu hỏi mà tôi đã phát hiện ra trong quá trình tìm kiếm tài liệu của mình.

Vì vậy, không theo thứ tự cụ thể:

1) Chính xác thì "mô hình quá trình ẩn" là gì?

Tôi đã vận hành theo ấn tượng rằng "mô hình quá trình ẩn" là một thuật ngữ ô có thể được sử dụng để mô tả một số loại mô hình thống kê khác nhau, tất cả các mô tả về xác suất của dữ liệu chuỗi thời gian được tạo bởi "một hệ thống chồng chéo, có khả năng ẩn, các quá trình phụ gia tuyến tính "([1]). Thật vậy, [2] định nghĩa "mô hình quá trình ẩn" là "thuật ngữ chung đề cập đến mô hình không gian trạng thái hoặc mô hình Markov ẩn". [1] dường như suy luận rằng một mô hình Markov ẩn là một kiểu con của các mô hình quá trình ẩn đặc biệt hướng đến suy luận về các trạng thái nhị phân; ý nghĩa cơ bản đối với tôi rằng một mô hình quy trình ẩn là sự khái quát hóa của một mô hình Markov ẩn. Đôi khi tôi thấy "mô hình quá trình ẩn" VÀ cụm từ "

Là trực giác của tôi về phần chính xác? Nếu không, có ai có một tài liệu tham khảo mô tả rõ hơn các phương pháp này không?

2) Sự khác biệt giữa Mô hình Markov ẩn và mô hình không gian trạng thái là gì?

Một lần nữa trở lại [2] (nếu chỉ vì bài báo đi kèm với một thuật ngữ rõ ràng, không phải vì bản thân bài báo có vẻ đặc biệt có thẩm quyền; nó chỉ là một nguồn thuận tiện cho các định nghĩa một câu), sự khác biệt dường như là Mô hình Markov ẩn là một loại mô hình không gian trạng thái cụ thể trong đó các trạng thái là Markovian (dường như không có giới hạn nhất định đối với thứ tự của quy trình Markov; tức là thứ tự đầu tiên, ..., thứ tự thứ k). Ở đây, một mô hình không gian trạng thái được định nghĩa là "Một mô hình chạy hai chuỗi thời gian song song, một mô hình nắm bắt động của các trạng thái thực (tiềm ẩn) và mô hình khác bao gồm các quan sát được thực hiện từ các trạng thái cơ bản nhưng có thể chưa biết này." Nếu những tiểu bang đó cũng trưng bày tài sản Markov, thì đó là Mô hình Markov ẩn.

Tuy nhiên, [3] định nghĩa sự khác biệt giữa các mô hình không gian trạng thái và Mô hình Markov ẩn là có liên quan đến các đặc điểm của trạng thái tiềm ẩn. Ở đây, Mô hình Markov ẩn xử lý các trạng thái riêng biệt trong khi mô hình không gian trạng thái xử lý các trạng thái liên tục; mặt khác, chúng giống hệt nhau về mặt khái niệm.

Đây dường như là hai định nghĩa rất khác nhau. Theo một, Mô hình Markov ẩn là một kiểu con của mô hình không gian trạng thái, trong khi ở bên kia, cả hai chỉ là các mô phỏng khác nhau của một lớp mô hình quy trình ẩn rộng hơn. Điều nào là đúng? Trực giác của tôi chỉ cho tôi đi theo [3] trái ngược với [2], nhưng tôi không thể tìm thấy một nguồn có thẩm quyền hỗ trợ việc này.

3) "Mô hình chuyển đổi Markov" là gì?

Một thuật ngữ khác xuất hiện trong nhiều nguồn là "mô hình chuyển đổi Markov". Tôi chưa thể tìm thấy cụm từ này trong bất kỳ sách giáo khoa nào, nhưng nó xuất hiện rất nhiều trong các bài báo (chỉ cần cắm nó vào Google để xác nhận). Tôi đã không thể tìm thấy một định nghĩa khắt khe về thuật ngữ này (mỗi bài báo tôi tìm thấy đều trích dẫn một bài báo khác, trích dẫn một bài khác, v.v., gửi cho tôi xuống một lỗ thỏ PubMed không dẫn đến đâu). Ấn tượng của tôi từ ngữ cảnh là một thuật ngữ rất chung để chỉ bất kỳ mô hình nào trong đó đối tượng suy luận là sự chuyển đổi giữa các trạng thái tuân theo quy trình Markov và Mô hình Markov ẩn có thể được coi là một loại mô hình chuyển đổi Markov cụ thể . [4], tuy nhiên, dường như sử dụng mô hình chuyển tiếp, Mô hình Markov ẩn và một số thuật ngữ tương tự có thể hoán đổi cho nhau.

Mặt khác, [5] nói về các mô hình chuyển đổi Markov và Mô hình Markov ẩn một chút khác biệt. Các tác giả nêu rõ: "Các mô hình chuyển tiếp cung cấp một phương pháp tóm tắt động lực học của người trả lời rất hữu ích cho việc diễn giải kết quả từ các mô hình Markov ẩn phức tạp hơn". Tôi hoàn toàn không hiểu ý nghĩa của cụm từ này và không thể tìm ra lời biện minh cho nó ở đâu đó trong bài báo. Tuy nhiên, dường như chúng ngụ ý rằng các mô hình chuyển đổi Markov sử dụng thời gian như một biến liên tục, trong khi các mô hình Markov ẩn sử dụng thời gian như một biến rời rạc (họ không nói trực tiếp điều này; họ nói rằng họ sử dụng gói R 'msm' để phù hợp với chuyển đổi Markov các mô hình và sau này mô tả 'msm' khi xử lý thời gian liên tục trái ngược với gói R cho HMM).

4) Các khái niệm khác, ví dụ như Dynamic Bayesian Networks, phù hợp ở đâu?

Theo Wikipedia, Mạng Bayes năng động là "tổng quát hóa các mô hình Markov ẩn và bộ lọc Kalman". Ở những nơi khác, tôi đã thấy các mô hình Markov ẩn được định nghĩa là trường hợp đặc biệt của Mạng Dynamic Bayes, "mà toàn bộ trạng thái của thế giới được biểu thị bằng một biến trạng thái ẩn duy nhất" ( Định nghĩa hệ thống Bayesian động và mối quan hệ của nó với HMM? ) . Tôi thường hiểu mối quan hệ này và nó được giải thích rõ bằng [6].

Tuy nhiên, tôi đang có một thời gian khó hiểu làm thế nào mối quan hệ này phù hợp trong bức tranh rộng lớn hơn của mọi thứ. Đó là, với mối quan hệ này giữa HMM và DBN, các mô hình không gian trạng thái và các mô hình quy trình ẩn có liên quan đến hai như thế nào? Làm thế nào để tất cả các loại phương thức khác nhau này liên quan đến nhau, cho rằng dường như có nhiều "khái quát hóa" của các mô hình Markov ẩn?


Người giới thiệu:

[1] Tom M. Mitchell, Rebecca Hutchinson, Indrayana Rustandi. "Các mô hình quy trình ẩn". 2006. CMU-CALD-05-116. Đại học Carnegie Mellon.

[2] Oliver Giminez, Jean-Dominique Lebreton, Jean-Michel Gaillard, Remi Choquet, Roger Pradel. "Ước tính các tham số nhân khẩu học bằng cách sử dụng các mô hình động quy trình ẩn". Sinh học dân số lý thuyết. 2012. 82 (4): 307-316.

[3] Barbara Engelhardt. "Mô hình Markov ẩn và Mô hình không gian nhà nước". STA561: Học máy xác suất. Đại học Duke. http://www.genome.duke.edu/labs/engelhardt/cifts/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt. "Mô hình hóa Markov tiềm ẩn đa cấp trong thời gian liên tục với một ứng dụng để phân tích dữ liệu đánh giá tâm trạng lưu động". Hội thảo thống kê xã hội. 2012. Đại học Tilburg. http://www.lse.ac.uk/statistic/events/ecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Ken Richardson, David Harte, Kristie Carter. "Hiểu về sự chuyển đổi lực lượng lao động và sức khỏe: Áp dụng các mô hình Markov vào dữ liệu theo chiều dọc của SoFIE". Loạt nghiên cứu thống kê chính thức. 2012.

[6] Zoubin Ghahramani. "Giới thiệu về các mô hình Markov ẩn và mạng Bayes". Tạp chí nhận dạng mẫu và trí tuệ nhân tạo. 2001. 15 (1): 9-42.


Bạn cũng có thể muốn dùng thử Mạng thần kinh tái phát. Trong nhận dạng giọng nói, một số người đã sử dụng chúng thành công thay thế cho HMM.
Albert

Cảm ơn vì đã góp ý. Tuy nhiên, hiện tại tôi muốn làm rõ các câu hỏi của mình về các kỹ thuật này trước khi chuyển sang nghiên cứu những cái mới.
Ryan Simmons

Họ đề cập đến điều tương tự. Vui lòng xem scholarpedia.org/article/State_space_model Sangdon

2
@Ryan Simmons Tôi nghĩ rằng sẽ là một ý tưởng tốt để xem video của mathmonk (còn gọi là Jeffrey Miller) về chuỗi markov và các mô hình markov ẩn trên youtube.
JimBoy

Vì bây giờ bạn có thể đã đưa ra luận điểm của mình, bạn có quan tâm để tự trả lời câu hỏi này không? Tôi cho một người muốn một chuyên gia trả lời ở đây, có lẽ cũng áp dụng cho gần 800 người khác đọc câu hỏi này.
Ulf Aslak

Câu trả lời:


4

Sau đây được trích dẫn từ trang web của Học viện :

Mô hình không gian trạng thái (SSM) đề cập đến một lớp mô hình đồ họa xác suất (Koller và Friedman, 2009) mô tả sự phụ thuộc xác suất giữa biến trạng thái tiềm ẩn và phép đo quan sát được. Trạng thái hoặc phép đo có thể là liên tục hoặc rời rạc. Thuật ngữ không gian nhà nước của người Viking có nguồn gốc từ những năm 1960 trong lĩnh vực kỹ thuật điều khiển (Kalman, 1960). SSM cung cấp một khung chung để phân tích các hệ thống động lực xác định và ngẫu nhiên được đo lường hoặc quan sát thông qua một quá trình ngẫu nhiên. Khung SSM đã được áp dụng thành công trong kỹ thuật, thống kê, khoa học máy tính và kinh tế để giải quyết một loạt các vấn đề về hệ thống động lực. Các thuật ngữ khác được sử dụng để mô tả SSM là các mô hình Markov ẩn (HMM) (Rabiner, 1989) và các mô hình quy trình tiềm ẩn. SSM được nghiên cứu nhiều nhất là bộ lọc Kalman,


3

Tôi và Alan Hawkes đã viết khá nhiều về các quá trình Markov tổng hợp với các trạng thái riêng biệt trong thời gian liên tục. Nội dung của chúng tôi là về vấn đề diễn giải các quan sát của các phân tử kênh ion đơn lẻ, và bao gồm một cách xử lý chính xác các sự kiện ngắn bị bỏ lỡ. Lý thuyết tương tự cũng hoạt động trong lý thuyết độ tin cậy. Nó cũng có thể thích nghi với các vấn đề khác. Xem http://www.onemol.org.uk/?page_id=175 để tham khảo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.