Tôi đã triển khai hệ thống NER với việc sử dụng thuật toán CRF với các tính năng thủ công của tôi đã cho kết quả khá tốt. Có điều là tôi đã sử dụng rất nhiều tính năng khác nhau bao gồm thẻ POS và bổ đề.
Bây giờ tôi muốn tạo cùng một NER cho các ngôn ngữ khác nhau. Vấn đề ở đây là tôi không thể sử dụng thẻ POS và bổ đề. Tôi bắt đầu đọc các bài viết về học tập sâu và học tập tính năng không giám sát.
Câu hỏi của tôi là:
Có thể sử dụng các phương pháp để học tính năng không giám sát với thuật toán CRF không? Có ai đã thử điều này và có bất kỳ kết quả tốt? Có bài viết hay hướng dẫn nào về vấn đề này không?
Tôi vẫn chưa hoàn toàn hiểu cách tạo tính năng này vì vậy tôi không muốn dành nhiều thời gian cho những thứ không hiệu quả. Vì vậy, bất kỳ thông tin sẽ thực sự hữu ích. Để tạo ra toàn bộ hệ thống NER dựa trên học tập sâu là một chút đến bây giờ.