Chuỗi Markov so với HMM


11

Chuỗi Markov có ý nghĩa với tôi, tôi có thể sử dụng chúng để mô hình hóa các thay đổi trạng thái xác suất trong các vấn đề thực tế trong cuộc sống. Sau đó đến HMM. HMM được cho là phù hợp hơn để mô hình hóa nhiều vấn đề hơn MC. Tuy nhiên, những vấn đề mà mọi người đề cập có phần phức tạp để hiểu như xử lý lời nói. Vì vậy, câu hỏi của tôi là bạn có thể mô tả một vấn đề "thực tế và đơn giản" mà HMM phù hợp hơn MC? và giải thích tại sao? cảm ơn

Câu trả lời:


19

Nhận dạng giọng nói không phức tạp như một ví dụ như bạn nghĩ.

Đầu tiên, hãy tưởng tượng tạo ra Chuỗi Markov (MC) nhận dạng văn bản. Chương trình của bạn đọc một loạt các văn bản (hoàn hảo, không có lỗi) và tính toán trạng thái (từ) và thay đổi trạng thái (từ tiếp theo). Âm thanh như bạn đã nhận được điều này xuống. Bây giờ bạn có thể tạo văn bản hoặc đưa ra một số văn bản dự đoán từ tiếp theo bằng cách sử dụng trạng thái và xác suất chuyển tiếp của MC của bạn.

Bây giờ hãy tưởng tượng rằng bạn muốn sử dụng MC của bạn với lời nói. Bạn sẽ chỉ cần mọi người đọc văn bản tương tự như MC của bạn và bạn đã đặt, phải không? Chà ... Ngoại trừ việc họ sẽ phát âm các từ khác nhau: trong đó văn bản viết là "khoai tây", bạn sẽ thực sự nghe thấy "po-TAY-toh" và "po-TAH-toh" và "pu-TAY -to ", v.v. Và ngược lại: văn bản" đã ăn "và" tám "đại diện cho hai trạng thái khác nhau, nhưng (thường) được phát âm giống nhau.

Thuật toán của bạn không còn thấy các trạng thái cơ bản (từ), nó nhìn thấy sự phân phối xác suất của cách phát âm cho mỗi từ. MC gốc của bạn được ẩn đằng sau các cách phát âm, và bây giờ mô hình của bạn cần phải có hai lớp.

Vì vậy, bạn có thể có nhiều người đọc to văn bản mà bạn đã sử dụng cho khóa đào tạo ban đầu của mình, bạn có thể nhận được phân phối cho cách phát âm cho mỗi từ, sau đó kết hợp mô hình ban đầu của bạn với mô hình phát âm và bạn có Mô hình Markov ẩn ( một HMM).

Hầu hết các vấn đề trong thế giới thực sẽ như thế này, vì thế giới thực có xu hướng ồn ào. Bạn sẽ không thực sự biết trạng thái của một cái gì đó. Thay vào đó, bạn sẽ nhận được nhiều chỉ số cho từng trạng thái: đôi khi cùng một chỉ báo cho các trạng thái khác nhau ("đã ăn" và "tám") và đôi khi các chỉ số khác nhau cho cùng một trạng thái ("pu-TAY-toe" và "pah-tah-TOE"). Do đó, HMM phù hợp hơn cho các vấn đề trong thế giới thực.

[Hai ghi chú bên lề: 1) nhận dạng giọng nói thực tế hoạt động ở cấp độ âm vị, không phải cấp độ từ và 2) Tôi tin rằng HMM là vua của đồi để nhận dạng giọng nói, nhưng gần đây đã bị truất ngôi bởi mạng lưới thần kinh sâu.]


6

Về cơ bản, HMM là một mô hình Markov trong đó trạng thái không thể quan sát được hoàn toàn, thay vào đó nó chỉ được quan sát gián tiếp thông qua một số quan sát ồn ào. Phần mô hình Markov là một cách đơn giản để áp đặt các phụ thuộc tạm thời trong trạng thái. Tương ứng, các vấn đề trong đó HMM hữu ích là những vấn đề mà nhà nước tuân theo mô hình Markov, nhưng bạn không quan sát trực tiếp trạng thái.

Có nhiều thứ bạn có thể làm với HMM. Một điều hữu ích bạn có thể làm là như sau - đưa ra một loạt các quan sát ồn ào cho đến thời điểm hiện tại, có lẽ bạn muốn biết trạng thái hiện tại có khả năng nhất của hệ thống là gì. Để làm điều này, bạn sẽ kết hợp một cách thích hợp cấu trúc chuỗi Markov với các quan sát để suy ra trạng thái. Tương tự, bạn có thể mở rộng điều này để suy ra toàn bộ chuỗi trạng thái từ chuỗi quan sát ( đây là tiêu chuẩn).

Trong khoa học và kỹ thuật, mô hình này được sử dụng mọi lúc. Ví dụ, có lẽ bạn đang quay video một con vật đơn giản như c. thanh lịch(một con sâu) và nó chỉ có một số lượng nhỏ các trạng thái hành vi rời rạc. Từ video, bạn muốn gắn nhãn cho từng khung hình với trạng thái hành vi của động vật. Từ một khung hình duy nhất, thuật toán ghi nhãn có một số lỗi / nhiễu. Tuy nhiên, cũng có những phụ thuộc tạm thời mà bạn có thể tạo mô hình bằng chuỗi Markov ... Nếu trong một khung hình, động vật ở một trạng thái, nó có khả năng ở cùng trạng thái cho khung tiếp theo (và có lẽ một số tiểu bang chỉ cho phép chuyển đổi đến một số tiểu bang khác). Về cơ bản, bằng cách kết hợp các quan sát khung đơn ồn ào của bạn với cấu trúc của các chuyển tiếp (bằng HMM), bạn có thể có được một chuỗi các ước tính trạng thái được làm mịn và ràng buộc tốt hơn.


2

HMM là một mô hình hỗn hợp. Cũng giống như hỗn hợp của Mô hình Gaussian . Lý do chúng tôi sử dụng nó ngoài Markov Chain, là việc nắm bắt các mẫu dữ liệu sẽ phức tạp hơn.

Tương tự như nếu chúng ta sử dụng một Gaussian để mô hình một biến gây tranh cãi HOẶC chúng ta sử dụng hỗn hợp Gaussian để mô hình một biến liên tục.

Tôi sẽ sử dụng một biến liên tục để demo ý tưởng này: giả sử chúng ta có dữ liệu này

nhập mô tả hình ảnh ở đây

Tốt hơn là mô hình hóa nó với 2 Gaussian và với tỷ lệ khác nhau. Đó là "tương đương" trong trường hợp riêng biệt: chúng tôi xây dựng HMM với 2 trạng thái ẩn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.