Tôi muốn bắt đầu thử nghiệm với mạng lưới thần kinh và như một vấn đề về đồ chơi, tôi muốn đào tạo một người để trò chuyện, tức là thực hiện một bot trò chuyện như smartbot. Dù sao cũng không thông minh.
Tôi đã tìm xung quanh một số tài liệu và tôi tìm thấy nhiều hướng dẫn về các nhiệm vụ chung, nhưng ít về chủ đề cụ thể này. Một trong những tôi tìm thấy chỉ đưa ra kết quả mà không đưa ra cái nhìn sâu sắc về việc thực hiện. Những người đã làm, đã làm nó khá nông (trang tài liệu tenorflow trên seq2seq đang thiếu imho).
Bây giờ, tôi cảm thấy tôi có thể đã hiểu nguyên tắc ít nhiều nhưng tôi không chắc và tôi thậm chí không chắc bắt đầu như thế nào. Do đó tôi sẽ giải thích cách tôi sẽ giải quyết vấn đề và tôi muốn phản hồi về giải pháp này, cho tôi biết tôi đã nhầm lẫn ở đâu và có thể có bất kỳ liên kết nào đến các giải thích chi tiết và kiến thức thực tế về quy trình.
Bộ dữ liệu tôi sẽ sử dụng cho nhiệm vụ này là kết xuất của tất cả lịch sử trò chuyện trên facebook và whatsapp của tôi. Tôi không biết nó sẽ lớn như thế nào nhưng có thể vẫn chưa đủ lớn. Ngôn ngữ đích không phải là tiếng Anh, do đó tôi không biết nơi nào nhanh chóng thu thập các mẫu hội thoại có ý nghĩa.
Tôi sẽ tạo ra một vectơ suy nghĩ trong mỗi câu. Vẫn không biết làm thế nào thực sự; Tôi tìm thấy một ví dụ hay cho word2vec trên trang web deeplearning4j, nhưng không có câu nào. Tôi đã hiểu cách các vectơ từ được xây dựng và tại sao, nhưng tôi không thể tìm thấy một lời giải thích thấu đáo cho các vectơ câu.
Sử dụng các vectơ suy nghĩ làm đầu vào và đầu ra Tôi sẽ đào tạo mạng lưới thần kinh. Tôi không biết nó nên có bao nhiêu lớp, và lớp nào phải là lớp lstm.
Sau đó, cần có một mạng lưới thần kinh khác có thể chuyển đổi một vectơ suy nghĩ thành một chuỗi các ký tự sáng tác một câu. Tôi đọc rằng tôi nên sử dụng phần đệm để bù cho các độ dài câu khác nhau, nhưng tôi nhớ cách mã hóa các ký tự (có đủ mật mã không?).