Bang AbuShawar & Atwell:
Chatbot là một tác nhân đàm thoại tương tác với người dùng lần lượt sử dụng ngôn ngữ tự nhiên. Các chatbot hoặc hệ thống đối thoại giữa người và máy tính khác nhau đã được phát triển bằng giao tiếp nói hoặc văn bản và đã được áp dụng trong các lĩnh vực khác nhau như: Nghiên cứu ngôn ngữ, giáo dục ngôn ngữ, dịch vụ khách hàng, trợ giúp trang web và cho vui.
Của họ và các bài báo khác truyền đạt một số trong nhiều cách tiếp cận hiện đại để đào tạo chatbot khi viết bài này.
Tự động trích xuất dữ liệu đào tạo Chatbot từ Tập đoàn đối thoại tự nhiên , Bayan AbuShawar, Eric Atwell, 2016
Tuy nhiên, hầu hết các chatbot bị giới hạn ở kiến thức được lưu trữ thủ công trong các tệp của chúng và đối với một ngôn ngữ tự nhiên cụ thể được viết hoặc nói. Bài viết này trình bày chương trình chúng tôi đã phát triển để chuyển đổi văn bản có thể đọc được bằng máy sang định dạng chatbot cụ thể, sau đó được sử dụng để đào tạo lại một chatbot và tạo một cuộc trò chuyện gần với ngôn ngữ của con người hơn. Các tập đoàn khác nhau đã được sử dụng: tập đoàn đối thoại như Tập đoàn Anh ngữ quốc gia Anh (BNC); cuốn sách thánh của Hồi giáo Kinh Qur'an là một tập thơ độc thoại trong đó câu thơ và câu sau là lượt; và Câu hỏi thường gặp trong đó câu hỏi và câu trả lời là cặp lượt. Mục tiêu chính của quá trình tự động hóa này là khả năng tạo ra các nguyên mẫu chatbot khác nhau nói các ngôn ngữ khác nhau dựa trên kho văn bản.
Bối cảnh-Không chắc chắn-Nhận thức về lựa chọn hành động Chatbot thông qua học tập tăng cường phụ trợ tham số , Chu Shandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun và Tenglun Tan, 2018
Chúng tôi đề xuất một chatbot nhận biết không chắc chắn theo ngữ cảnh và mô hình học tập củng cố (RL) để đào tạo chatbot. Mô hình đề xuất được đặt tên là Chỉ số diễn viên lợi thế không đồng bộ phụ trợ tham số (PA4C). Chúng tôi sử dụng một trình giả lập người dùng để mô phỏng sự không chắc chắn của sự tự tin của người dùng trong bối cảnh hội thoại. So với các cách tiếp cận dựa trên quy tắc ngây thơ, chatbot của chúng tôi được đào tạo thông qua mô hình PA4C tránh lựa chọn hành động thủ công và mạnh mẽ hơn đối với phương sai phát ngôn của người dùng. Mô hình PA4C tối ưu hóa các mô hình RL thông thường với tham số hành động và các tác vụ phụ trợ cho đào tạo chatbot, giải quyết các vấn đề của không gian hành động lớn và trạng thái không thưởng. Chúng tôi đánh giá mô hình PA4C qua việc đào tạo một chatbot cho các nhiệm vụ tạo sự kiện lịch.
Đào tạo hệ thống học tập được giám sát bằng cách sử dụng Chatbot Tương tác , Ấn bản đơn đăng ký bằng sáng chế Hoa Kỳ 0034828 A1, International Business Machines Corporation, Armonk, NY, US, 2019
Phương pháp do máy tính thực hiện bao gồm nhận và phân tích điểm dữ liệu để xác định tham số của điểm dữ liệu, tạo phiếu cảnh báo dựa trên phân tích điểm dữ liệu, liên lạc, qua chatbot, ít nhất là một số thông tin có trong vé cảnh báo đến một hoặc nhiều người dùng hơn và phân loại, thông qua chatbot, điểm dữ liệu dẫn đến vé cảnh báo dựa trên hành vi của thiết bị tạo điểm dữ liệu. Jonathan A. Cagadas, Alexander D. Lewitt, Simon D. Mikulcik, Karan Shukla, Leigh A. Williamson
Đào tạo hai bước và mã hóa hỗn hợp - Giải mã để triển khai một Chatbot sáng tạo với một Corpus đối thoại nhỏ , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016
Các mô hình chatbot được tạo dựa trên các mạng theo trình tự có thể tạo ra các tương tác hội thoại tự nhiên nếu một khối đối thoại khổng lồ được sử dụng làm dữ liệu huấn luyện. Tuy nhiên, ngoại trừ một vài ngôn ngữ như tiếng Anh và tiếng Trung Quốc, vẫn khó thu thập được một kho đối thoại lớn. Để giải quyết vấn đề này, chúng tôi đề xuất một mô hình chatbot bằng cách sử dụng hỗn hợp các từ và âm tiết làm đơn vị giải mã mã hóa. Ngoài ra, chúng tôi đề xuất một phương pháp đào tạo gồm hai bước, bao gồm đào tạo trước bằng cách sử dụng một khối lượng lớn không đối thoại và đào tạo lại bằng cách sử dụng một khối đối thoại nhỏ. Trong các thí nghiệm của chúng tôi, các đơn vị hỗn hợp đã được hiển thị để giúp giảm các vấn đề ngoài từ vựng (OOV). Hơn nữa, phương pháp đào tạo hai bước có hiệu quả trong việc giảm các lỗi ngữ pháp và ngữ nghĩa trong các phản hồi khi chatbot được đào tạo bằng cách sử dụng một đoạn hội thoại nhỏ (533,
Lựa chọn dữ liệu lấy cảm hứng từ mô hình con cho đào tạo Chatbot hướng đến mục tiêu dựa trên các câu nhúng , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018
Các hệ thống hiểu ngôn ngữ nói (SLU), chẳng hạn như chatbot hướng tới mục tiêu hoặc trợ lý cá nhân, dựa trên mô-đun hiểu ngôn ngữ tự nhiên ban đầu (NLU) để xác định ý định và trích xuất thông tin liên quan từ các truy vấn người dùng mà họ sử dụng làm đầu vào. Các hệ thống SLU thường giúp người dùng giải quyết các vấn đề trong các miền tương đối hẹp và yêu cầu một lượng lớn dữ liệu đào tạo trong miền. Điều này dẫn đến các vấn đề sẵn có dữ liệu quan trọng ngăn cản sự phát triển của các hệ thống thành công. Để giảm bớt vấn đề này, chúng tôi đề xuất một kỹ thuật lựa chọn dữ liệu trong chế độ dữ liệu thấp cho phép chúng tôi đào tạo với ít câu có nhãn hơn, do đó chi phí ghi nhãn nhỏ hơn. Chúng tôi đề xuất một chức năng xếp hạng dữ liệu lấy cảm hứng từ mô hình con, mức tăng biên tỷ lệ phạt hình phạt, để chọn điểm dữ liệu cho nhãn chỉ dựa trên thông tin được trích xuất từ không gian nhúng văn bản. Chúng tôi chỉ ra rằng khoảng cách trong không gian nhúng là nguồn thông tin khả thi có thể được sử dụng để lựa chọn dữ liệu. Phương pháp của chúng tôi vượt trội hơn hai kỹ thuật học tập tích cực đã biết và cho phép đào tạo hiệu quả chi phí của đơn vị NLU. Hơn nữa, kỹ thuật lựa chọn đề xuất của chúng tôi không cần mô hình được đào tạo lại giữa các bước lựa chọn, làm cho nó hiệu quả về thời gian.