Làm thế nào để các nhà khoa học đưa ra các tham số và cấu trúc liên kết ẩn Markov chính xác để sử dụng?


10

Tôi hiểu cách Mô hình Markov ẩn được sử dụng trong trình tự bộ gen, chẳng hạn như tìm gen. Nhưng tôi không hiểu làm thế nào để đưa ra một mô hình Markov cụ thể. Ý tôi là, mô hình nên có bao nhiêu tiểu bang? Có bao nhiêu chuyển tiếp có thể? Mô hình nên có một vòng lặp?

Làm thế nào họ biết rằng mô hình của họ là tối ưu?

Họ có tưởng tượng, nói 10 mô hình khác nhau, điểm chuẩn 10 mô hình đó và xuất bản mô hình tốt nhất?

Câu trả lời:


6

Tôi quen thuộc với ba cách tiếp cận chính:

  1. Một tiên nghiệm. Bạn có thể biết rằng có bốn cặp cơ sở để chọn và do đó, cho phép HMM có bốn trạng thái. Hoặc bạn có thể biết rằng tiếng Anh có 44 âm vị và do đó, có 44 trạng thái cho lớp âm vị ẩn trong mô hình nhận dạng giọng nói.

  2. Ước lượng. Số lượng trạng thái thường có thể được ước tính trước, có lẽ bằng cách phân cụm đơn giản trên các tính năng quan sát được của HMM. Nếu ma trận chuyển tiếp HMM là hình tam giác (thường là trường hợp dự đoán thất bại), số lượng trạng thái xác định hình dạng phân phối tổng thời gian từ trạng thái bắt đầu đến trạng thái kết thúc.

  3. Tối ưu hóa. Giống như bạn đề xuất, nhiều mô hình được tạo và phù hợp và mô hình tốt nhất được chọn. Người ta cũng có thể điều chỉnh phương pháp học HMM để cho phép mô hình thêm hoặc loại bỏ các trạng thái khi cần thiết.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.