Đây là một câu hỏi khá chung chung: giả sử tôi muốn xây dựng một mô hình để dự đoán quan sát tiếp theo dựa trên các quan sát trước đó ( có thể là một tham số để tối ưu hóa thực nghiệm). Vì vậy, về cơ bản chúng ta có một cửa sổ trượt của các tính năng đầu vào để dự đoán các quan sát tiếp theo.N
Tôi có thể sử dụng cách tiếp cận Mô hình Markov ẩn, tức là Baum-Welch để ước tính mô hình, sau đó Viterbi để dự đoán trạng thái hiện tại dựa trên các quan sát cuối cùng , sau đó dự đoán trạng thái tiếp theo có khả năng nhất dựa trên trạng thái hiện tại, sau đó dự đoán trạng thái tiếp theo quan sát bằng cách sử dụng trạng thái tiếp theo có khả năng nhất và các tham số HMM (hoặc các biến thể, chẳng hạn như tìm phân phối dự đoán của quan sát tiếp theo).
Hoặc tôi có thể sử dụng một cách tiếp cận đơn giản hơn nhiều, sử dụng mô hình không trạng thái (có thể lấy đầu vào của các quan sát trước đó ), ví dụ SVM, hồi quy tuyến tính, spline, cây hồi quy, hàng xóm gần nhất, v.v. Các mô hình như vậy dựa trên việc giảm thiểu một số lỗi dự đoán trên tập huấn luyện và do đó, về mặt khái niệm, đơn giản hơn nhiều so với mô hình dựa trên trạng thái ẩn.
Ai đó có thể chia sẻ kinh nghiệm của cô ấy / anh ấy trong việc đối phó với sự lựa chọn người mẫu như vậy không? Điều gì sẽ nói có lợi cho HMM và điều gì có lợi cho phương pháp hồi quy? Theo trực giác người ta nên lấy mô hình đơn giản hơn có thể để tránh phù hợp quá mức; điều này nói lên sự ủng hộ của cách tiếp cận không trạng thái ... Chúng ta cũng phải xem xét rằng cả hai cách tiếp cận đều có cùng một dữ liệu đầu vào để đào tạo (tôi nghĩ điều này ngụ ý rằng nếu chúng ta không kết hợp kiến thức miền bổ sung trong mô hình hóa mô hình trạng thái ẩn, ví dụ sửa các trạng thái nhất định và xác suất chuyển tiếp, không có lý do tại sao một mô hình trạng thái ẩn sẽ hoạt động tốt hơn). Cuối cùng, người ta có thể chơi với cả hai cách tiếp cận và xem những gì hoạt động tốt hơn trên một bộ xác nhận, nhưng một số phương pháp phỏng đoán dựa trên kinh nghiệm thực tế cũng có thể hữu ích ...
Lưu ý: đối với tôi, điều quan trọng là chỉ dự đoán một số sự kiện nhất định; Tôi thích một mô hình dự đoán tốt một vài sự kiện "thú vị / hiếm" , hơn là một mô hình dự đoán các sự kiện "trung bình / thường xuyên" nhưng những sự kiện thú vị không tốt lắm. Có lẽ điều này có một hàm ý cho sự lựa chọn người mẫu. Cảm ơn.