Có, GAN có thể được sử dụng cho văn bản. Tuy nhiên, có một vấn đề trong sự kết hợp giữa cách GAN hoạt động và cách văn bản thường được tạo bởi các mạng thần kinh:
- GAN hoạt động bằng cách truyền bá gradient thông qua thành phần của Trình tạo và Phân biệt đối xử.
- Văn bản thường được tạo bằng cách có lớp softmax cuối cùng trên không gian mã thông báo, nghĩa là, đầu ra của mạng thường là xác suất tạo ra mỗi mã thông báo (nghĩa là một đơn vị ngẫu nhiên rời rạc).
Cả hai thứ này không hoạt động tốt với nhau, vì bạn không thể truyền độ dốc thông qua các đơn vị ngẫu nhiên rời rạc. Có hai cách tiếp cận chính để giải quyết vấn đề này: thuật toán REINFORCE và tham số hóa lại Gumbel-Softmax (còn được gọi là phân phối cụ thể ). Hãy xem xét rằng REINFORCE được biết là có phương sai cao, do đó bạn cần một lượng lớn dữ liệu để có được ước tính độ dốc tốt.
Như một ví dụ về TÁI TẠO cho GAN văn bản, bạn có thể kiểm tra bài viết SeqGAN . Một ví dụ về Gumbel-Softmax bạn có thể kiểm tra bài viết này .
Một tùy chọn hoàn toàn khác là không có một đơn vị ngẫu nhiên rời rạc như đầu ra của trình tạo (ví dụ: tạo mã thông báo một cách xác định trong không gian nhúng), do đó loại bỏ vấn đề ban đầu là sao lưu qua chúng.