Các phương pháp mới nhất để đào tạo một bot trò chuyện là gì?


11

Tôi muốn đào tạo một bot sử dụng nhập văn bản, ghi nhớ một vài loại và trả lời các câu hỏi tương ứng. Ngoài phiên bản 2.0, tôi cũng muốn tạo bot để trả lời đầu vào bằng giọng nói. Các thuật toán máy học / AI mới nhất có sẵn cho cùng là gì? Làm ơn cho tôi biết.


kiểm tra mạng động-bộ nhớ-thần kinh
riemann77

Xem xét sử dụng ánh xạ toán học symantic .
Sergei

Câu trả lời:


1

Câu hỏi của bạn rất rộng - vì vậy, trong câu trả lời, hai khung rộng tôi khuyến khích bạn xem xét là:

  1. Để phát triển cuộc trò chuyện chatbot tiên tiến, http://rasa.ai là một khung công tác nguồn mở có khả năng thích ứng cao hơn các hệ thống dựa trên quy tắc truyền thống
  2. Để nhận dạng giọng nói, hãy xem https://discference.mozilla.org/c/deep-speech cũng là nguồn mở.

0

Nếu bot của bạn đang "ghi nhớ" một vài danh mục và sau đó trả lời các câu hỏi, thì nó hoàn toàn vô dụng trong kịch bản hiện tại. bởi vì trong trường hợp đó, nó thực hiện rất kém trên một tập dữ liệu khác nhau (bộ kiểm tra). trong thuật ngữ thống kê, nó được gọi là "quá mức". và đi đến trả lời câu hỏi, không có quy tắc nào để xác định thuật toán "hiện đại". mặc dù bạn có thể kiểm tra một vài mô hình hoạt động độc đáo trên babi hoặc các bộ dữ liệu tương tự như mạng bộ nhớ động hoặc mô hình seQ2seQ. để có được ý tưởng cơ bản về lĩnh vực này, tôi khuyên bạn nên học lingo máy học cơ bản và sau đó chuyển sang một số khóa học xử lý ngôn ngữ tự nhiên tiên tiến (stanford cung cấp cs224n).


0

Bang AbuShawar & Atwell:

Chatbot là một tác nhân đàm thoại tương tác với người dùng lần lượt sử dụng ngôn ngữ tự nhiên. Các chatbot hoặc hệ thống đối thoại giữa người và máy tính khác nhau đã được phát triển bằng giao tiếp nói hoặc văn bản và đã được áp dụng trong các lĩnh vực khác nhau như: Nghiên cứu ngôn ngữ, giáo dục ngôn ngữ, dịch vụ khách hàng, trợ giúp trang web và cho vui.

Của họ và các bài báo khác truyền đạt một số trong nhiều cách tiếp cận hiện đại để đào tạo chatbot khi viết bài này.

Tự động trích xuất dữ liệu đào tạo Chatbot từ Tập đoàn đối thoại tự nhiên , Bayan AbuShawar, Eric Atwell, 2016

Tuy nhiên, hầu hết các chatbot bị giới hạn ở kiến ​​thức được lưu trữ thủ công trong các tệp của chúng và đối với một ngôn ngữ tự nhiên cụ thể được viết hoặc nói. Bài viết này trình bày chương trình chúng tôi đã phát triển để chuyển đổi văn bản có thể đọc được bằng máy sang định dạng chatbot cụ thể, sau đó được sử dụng để đào tạo lại một chatbot và tạo một cuộc trò chuyện gần với ngôn ngữ của con người hơn. Các tập đoàn khác nhau đã được sử dụng: tập đoàn đối thoại như Tập đoàn Anh ngữ quốc gia Anh (BNC); cuốn sách thánh của Hồi giáo Kinh Qur'an là một tập thơ độc thoại trong đó câu thơ và câu sau là lượt; và Câu hỏi thường gặp trong đó câu hỏi và câu trả lời là cặp lượt. Mục tiêu chính của quá trình tự động hóa này là khả năng tạo ra các nguyên mẫu chatbot khác nhau nói các ngôn ngữ khác nhau dựa trên kho văn bản.

Bối cảnh-Không chắc chắn-Nhận thức về lựa chọn hành động Chatbot thông qua học tập tăng cường phụ trợ tham số , Chu Shandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun và Tenglun Tan, 2018

Chúng tôi đề xuất một chatbot nhận biết không chắc chắn theo ngữ cảnh và mô hình học tập củng cố (RL) để đào tạo chatbot. Mô hình đề xuất được đặt tên là Chỉ số diễn viên lợi thế không đồng bộ phụ trợ tham số (PA4C). Chúng tôi sử dụng một trình giả lập người dùng để mô phỏng sự không chắc chắn của sự tự tin của người dùng trong bối cảnh hội thoại. So với các cách tiếp cận dựa trên quy tắc ngây thơ, chatbot của chúng tôi được đào tạo thông qua mô hình PA4C tránh lựa chọn hành động thủ công và mạnh mẽ hơn đối với phương sai phát ngôn của người dùng. Mô hình PA4C tối ưu hóa các mô hình RL thông thường với tham số hành động và các tác vụ phụ trợ cho đào tạo chatbot, giải quyết các vấn đề của không gian hành động lớn và trạng thái không thưởng. Chúng tôi đánh giá mô hình PA4C qua việc đào tạo một chatbot cho các nhiệm vụ tạo sự kiện lịch.

Đào tạo hệ thống học tập được giám sát bằng cách sử dụng Chatbot Tương tác , Ấn bản đơn đăng ký bằng sáng chế Hoa Kỳ 0034828 A1, International Business Machines Corporation, Armonk, NY, US, 2019

Phương pháp do máy tính thực hiện bao gồm nhận và phân tích điểm dữ liệu để xác định tham số của điểm dữ liệu, tạo phiếu cảnh báo dựa trên phân tích điểm dữ liệu, liên lạc, qua chatbot, ít nhất là một số thông tin có trong vé cảnh báo đến một hoặc nhiều người dùng hơn và phân loại, thông qua chatbot, điểm dữ liệu dẫn đến vé cảnh báo dựa trên hành vi của thiết bị tạo điểm dữ liệu. Jonathan A. Cagadas, Alexander D. Lewitt, Simon D. Mikulcik, Karan Shukla, Leigh A. Williamson

Đào tạo hai bước và mã hóa hỗn hợp - Giải mã để triển khai một Chatbot sáng tạo với một Corpus đối thoại nhỏ , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016

Các mô hình chatbot được tạo dựa trên các mạng theo trình tự có thể tạo ra các tương tác hội thoại tự nhiên nếu một khối đối thoại khổng lồ được sử dụng làm dữ liệu huấn luyện. Tuy nhiên, ngoại trừ một vài ngôn ngữ như tiếng Anh và tiếng Trung Quốc, vẫn khó thu thập được một kho đối thoại lớn. Để giải quyết vấn đề này, chúng tôi đề xuất một mô hình chatbot bằng cách sử dụng hỗn hợp các từ và âm tiết làm đơn vị giải mã mã hóa. Ngoài ra, chúng tôi đề xuất một phương pháp đào tạo gồm hai bước, bao gồm đào tạo trước bằng cách sử dụng một khối lượng lớn không đối thoại và đào tạo lại bằng cách sử dụng một khối đối thoại nhỏ. Trong các thí nghiệm của chúng tôi, các đơn vị hỗn hợp đã được hiển thị để giúp giảm các vấn đề ngoài từ vựng (OOV). Hơn nữa, phương pháp đào tạo hai bước có hiệu quả trong việc giảm các lỗi ngữ pháp và ngữ nghĩa trong các phản hồi khi chatbot được đào tạo bằng cách sử dụng một đoạn hội thoại nhỏ (533,

Lựa chọn dữ liệu lấy cảm hứng từ mô hình con cho đào tạo Chatbot hướng đến mục tiêu dựa trên các câu nhúng , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018

Các hệ thống hiểu ngôn ngữ nói (SLU), chẳng hạn như chatbot hướng tới mục tiêu hoặc trợ lý cá nhân, dựa trên mô-đun hiểu ngôn ngữ tự nhiên ban đầu (NLU) để xác định ý định và trích xuất thông tin liên quan từ các truy vấn người dùng mà họ sử dụng làm đầu vào. Các hệ thống SLU thường giúp người dùng giải quyết các vấn đề trong các miền tương đối hẹp và yêu cầu một lượng lớn dữ liệu đào tạo trong miền. Điều này dẫn đến các vấn đề sẵn có dữ liệu quan trọng ngăn cản sự phát triển của các hệ thống thành công. Để giảm bớt vấn đề này, chúng tôi đề xuất một kỹ thuật lựa chọn dữ liệu trong chế độ dữ liệu thấp cho phép chúng tôi đào tạo với ít câu có nhãn hơn, do đó chi phí ghi nhãn nhỏ hơn. Chúng tôi đề xuất một chức năng xếp hạng dữ liệu lấy cảm hứng từ mô hình con, mức tăng biên tỷ lệ phạt hình phạt, để chọn điểm dữ liệu cho nhãn chỉ dựa trên thông tin được trích xuất từ ​​không gian nhúng văn bản. Chúng tôi chỉ ra rằng khoảng cách trong không gian nhúng là nguồn thông tin khả thi có thể được sử dụng để lựa chọn dữ liệu. Phương pháp của chúng tôi vượt trội hơn hai kỹ thuật học tập tích cực đã biết và cho phép đào tạo hiệu quả chi phí của đơn vị NLU. Hơn nữa, kỹ thuật lựa chọn đề xuất của chúng tôi không cần mô hình được đào tạo lại giữa các bước lựa chọn, làm cho nó hiệu quả về thời gian.


-1

Bạn có thể làm việc với Mạng thần kinh tái phát với LSTM hoặc GRU dưới dạng các ô nhớ và các từ nhúng như Word2vec. Các mô hình tìm kiếm và chú ý chùm tia cũng có thể được sử dụng với các RNN để mạnh mẽ hơn và ít sai lệch hơn. Nhưng kết quả đầu ra trong số này chỉ được đánh giá cao ở một mức độ nào đó khi nghiên cứu trong lĩnh vực này vẫn còn nóng và còn nhiều điều cần làm sáng tỏ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.