Đây là những gì tôi học được gần đây.
Rõ ràng, khi nói về RNN thế hệ văn bản, chúng ta đang nói về các mô hình ngôn ngữ RNN. Khi hỏi về RNNs tạo văn bản dựa trên từ / char , chúng tôi đang hỏi về các mô hình ngôn ngữ RNN dựa trên từ / char (LM).
LM dựa trên từ hiển thị độ chính xác cao hơn và chi phí tính toán thấp hơn so với LM dựa trên char.
Việc giảm hiệu suất này khó xảy ra do khó khăn cho mô hình cấp độ ký tự để ghi lại bộ nhớ ngắn hạn dài hơn, do các mạng tái phát Bộ nhớ ngắn hạn dài hơn (LSTM) hoạt động tốt hơn với đầu vào dựa trên từ.
Điều này là do các LM RNN dựa trên char yêu cầu lớp ẩn lớn hơn nhiều để mô hình thành công các phụ thuộc dài hạn có nghĩa là chi phí tính toán cao hơn.
Do đó, chúng ta có thể nói rằng
một trong những khác biệt cơ bản giữa các mô hình cấp độ từ và cấp độ ký tự nằm ở số lượng tham số mà RNN phải truy cập trong quá trình đào tạo và kiểm tra. Lớp nhỏ hơn là lớp đầu vào và đầu ra của RNN, lớp lớn hơn cần phải là lớp ẩn được kết nối đầy đủ, khiến cho việc đào tạo mô hình trở nên đắt đỏ.
Tuy nhiên, các ngôn ngữ RNN LM dựa trên char tốt hơn với các hình thái phong phú như Kết thúc, tiếng Thổ Nhĩ Kỳ, tiếng Nga, v.v ... Sử dụng RNN LM dựa trên từ để mô hình hóa các ngôn ngữ đó là khó khăn nếu có thể và không được khuyến khích.
Phân tích trên có ý nghĩa đặc biệt khi bạn nhìn vào văn bản đầu ra, được tạo bởi các RNN dựa trên char:
Điều ngạc nhiên ở các nhà đầu tư sẽ không tăng tiền. Tôi không phải là công ty với thời gian có tất cả đều thú vị một cách nhanh chóng, không cần phải rời khỏi cùng các lập trình viên.
Mặc dù LM tối đa dựa trên char đơn giản với cửa sổ 13 ký tự mang lại điều này:
Và khi cô làm nhiều viên gạch chắc chắn. Anh xếp chúng thành đống và dậm chân cô. Bác sĩ chẩn đoán anh ta bị dơi. Cô gái và bạn trai yêu cầu cô ấy ra ngoài.
Tất nhiên tôi đã chọn ví dụ (thực tế hầu hết các ví dụ ML LM trông tốt hơn bất kỳ văn bản RNN nào tôi đã đọc từ trước đến nay) và ML LM nhỏ bé này đã được đào tạo trên một kho văn bản đơn giản hơn nhưng bạn có ý tưởng: xác suất có điều kiện đơn giản tạo ra tốt hơn văn bản hơn RNN dựa trên char phức tạp hơn nhiều .
Các LM RNN dựa trên Char có thể bắt chước các trình tự chính xác về mặt ngữ pháp cho một loạt các ngôn ngữ, yêu cầu lớp ẩn lớn hơn và đắt hơn về mặt tính toán trong khi các LM RNN dựa trên từ luyện tập nhanh hơn và tạo ra các văn bản mạch lạc hơn và thậm chí các văn bản được tạo này còn xa hơn .