Đây là loại tiếp theo cho câu hỏi này về hướng nghiên cứu NLG trong lĩnh vực ngôn ngữ học.
Làm thế nào để các công cụ trợ lý cá nhân như Siri, Google Now hoặc Cortana thực hiện Tạo ngôn ngữ tự nhiên (NLG)? Cụ thể, phần tạo văn bản câu . Tôi không quan tâm đến phần chuyển văn bản thành giọng nói, chỉ là phần tạo văn bản.
Tôi không tìm kiếm chính xác làm thế nào mỗi người làm điều đó, vì thông tin đó có thể không có sẵn.
Tôi tự hỏi những gì thiết lập được yêu cầu để thực hiện tạo câu có chất lượng đó?
- Bạn cần loại dữ liệu nào trong cơ sở dữ liệu (ở mức cao)?
- Có yêu cầu phải có một từ điển của mỗi từ có thể và ý nghĩa của nó, cùng với nhiều cuốn sách / chú thích được phân tích và phân tích thống kê được thêm vào từ đó không?
- Có yêu cầu thực sự ghi âm mọi người nói chuyện theo cách tự nhiên (chẳng hạn như từ chương trình TV hoặc podcast), phiên âm chúng thành văn bản và sau đó thêm bằng cách nào đó vào "hệ thống" của họ không? (để có được những câu thực sự giống "con người")
- Hoặc chỉ có các mẫu câu dựa trên cú pháp đơn giản mà họ đang sử dụng, không có cơ sở dữ liệu "nghĩa" ngữ nghĩa khổng lồ? Trường hợp ai đó chỉ viết một loạt các loại biểu thức thông thường ..
- Các thuật toán được sử dụng cho các câu giống như con người được viết tự nhiên là gì?
Một lý do để hỏi là, có vẻ như lĩnh vực NLG rất xa để có thể làm những gì Siri và Google Now và những người khác đang hoàn thành. Vì vậy, những loại công cụ họ đang làm? (Chỉ dành cho phần tạo văn bản câu).