Những gì được ẩn và những gì được quan sát
Thứ được ẩn trong mô hình Markov ẩn cũng giống như thứ được ẩn trong mô hình hỗn hợp rời rạc, vì vậy, để rõ ràng, hãy quên động lực của trạng thái ẩn và sử dụng mô hình hỗn hợp hữu hạn làm ví dụ. 'Trạng thái' trong mô hình này là danh tính của thành phần gây ra mỗi lần quan sát. Trong lớp mô hình này, các nguyên nhân như vậy không bao giờ được quan sát, do đó, 'nguyên nhân ẩn' được dịch theo thống kê thành tuyên bố rằng dữ liệu được quan sát có các phụ thuộc biên được loại bỏ khi biết thành phần nguồn. Và các thành phần nguồn được ước tính là bất cứ điều gì làm cho mối quan hệ thống kê này đúng.
Điều được ẩn giấu trong một mạng nơ ron đa lớp tiến bộ với các đơn vị trung gian sigmoid là trạng thái của các đơn vị đó, không phải là đầu ra là mục tiêu của suy luận. Khi đầu ra của mạng là một phân loại, nghĩa là phân phối xác suất trên các danh mục đầu ra có thể, các giá trị đơn vị ẩn này xác định một khoảng trống trong đó các danh mục có thể tách rời. Thủ thuật trong việc học một mô hình như vậy là tạo một không gian ẩn (bằng cách điều chỉnh ánh xạ ra khỏi các đơn vị đầu vào) trong đó vấn đề là tuyến tính. Do đó, toàn bộ ranh giới quyết định phi tuyến tính có thể từ toàn bộ hệ thống.
Sáng tạo so với phân biệt đối xử
Mô hình hỗn hợp (và HMM) là một mô hình của quá trình tạo dữ liệu, đôi khi được gọi là khả năng hoặc 'mô hình chuyển tiếp'. Khi được kết hợp với một số giả định về xác suất trước đó của mỗi trạng thái, bạn có thể suy ra phân phối trên các giá trị có thể có của trạng thái ẩn bằng định lý Bayes (một cách tiếp cận tổng quát). Lưu ý rằng, mặc dù được gọi là 'trước', cả tham số trước và tham số trong khả năng thường được học từ dữ liệu.
Ngược lại với mô hình hỗn hợp (và HMM), mạng lưới thần kinh học phân phối hậu nghiệm trực tiếp trên các loại đầu ra (một cách tiếp cận phân biệt đối xử). Điều này là có thể bởi vì các giá trị đầu ra đã được quan sát trong quá trình ước tính. Và vì chúng đã được quan sát, không cần thiết phải xây dựng phân phối sau từ một mô hình trước và một mô hình cụ thể cho khả năng như hỗn hợp. Các hậu sinh được học trực tiếp từ dữ liệu, đó là hiệu quả hơn và ít phụ thuộc vào mô hình.
Pha trộn và kết hợp
Để làm cho mọi thứ trở nên khó hiểu hơn, các cách tiếp cận này có thể được trộn lẫn với nhau, ví dụ như khi trạng thái mô hình hỗn hợp (hoặc HMM) đôi khi thực sự được quan sát. Khi đó là sự thật, và trong một số trường hợp khác không liên quan ở đây, có thể đào tạo phân biệt đối xử trong một mô hình thế hệ khác. Tương tự như vậy, có thể thay thế ánh xạ mô hình hỗn hợp của HMM bằng mô hình chuyển tiếp linh hoạt hơn, ví dụ, mạng lưới thần kinh.
Những câu hỏi
Vì vậy, không hoàn toàn đúng khi cả hai mô hình dự đoán trạng thái ẩn. HMM có thể được sử dụng để dự đoán trạng thái ẩn, mặc dù chỉ là loại mà mô hình chuyển tiếp đang mong đợi. Mạng lưới thần kinh có thể được sử dụng để dự đoán trạng thái chưa được quan sát , ví dụ như trạng thái trong tương lai có dự đoán. Loại trạng thái này không bị ẩn trong nguyên tắc, nó chỉ chưa được quan sát.
Khi nào bạn sẽ sử dụng cái này chứ không phải cái kia? Vâng, mạng lưới thần kinh làm cho các mô hình chuỗi thời gian khá khó xử theo kinh nghiệm của tôi. Họ cũng cho rằng bạn đã quan sát đầu ra. HMM không nhưng bạn thực sự không có bất kỳ sự kiểm soát nào về trạng thái ẩn thực sự là gì. Tuy nhiên, họ là mô hình chuỗi thời gian thích hợp.