Điều này không thể thêm nhiều hơn những nỗ lực thu thập dữ liệu trực tiếp của bạn.
Chất lượng của các đầu ra GAN hiện tại (tính đến năm 2017) sẽ không đủ cao. Các hình ảnh do GAN tạo ra thường nhỏ và có thể có các chi tiết bất thường / mơ hồ và các biến dạng kỳ lạ. Trong bài báo mà bạn liên kết, các hình ảnh được hệ thống tạo ra từ một câu có các khối màu đáng tin cậy được đưa ra cho chủ đề, nhưng không có câu mồi cho bạn, những gì bạn mong đợi hầu hết chúng không thể nhận ra như bất kỳ chủ đề cụ thể nào .
Các GAN với mục đích ít tham vọng hơn là tạo ra hình ảnh từ các câu (bất chấp sự chỉ trích của tôi ở trên, một IMO kỳ công thực sự đáng chú ý) sẽ tạo ra gần hơn với hình ảnh thực tế. Nhưng phạm vi của chúng sẽ ít hơn và có thể không bao gồm loại hình ảnh mong muốn của bạn. Ngoài ra, thông thường kích thước đầu ra là nhỏ, ví dụ 64x64 hoặc 128x128 *, và vẫn còn đủ các biến dạng và sự mơ hồ mà các bức ảnh chân thực mặt đất ban đầu sẽ được ưa chuộng hơn nhiều.
GAN bị giới hạn bởi thư viện đào tạo có sẵn - nó sẽ không hoạt động tốt nếu bạn cố gắng tạo hình ảnh bên ngoài phạm vi dữ liệu đào tạo của nó. Các kết quả thể hiện trong tài liệu nghiên cứu tất nhiên tập trung vào miền được cung cấp bởi dữ liệu đào tạo. Nhưng bạn không thể đưa bất kỳ câu nào vào mô hình này và mong đợi một kết quả sẽ hữu ích ở nơi khác.
Nếu bạn tìm thấy một GAN đã được đào tạo về một bộ dữ liệu phù hợp cho vấn đề của bạn, thì rất có thể bạn nên cố gắng tìm nguồn dữ liệu tương tự trực tiếp cho dự án của mình.
Nếu bạn đang gặp vấn đề với dữ liệu thực tế hạn chế, thì có lẽ cách tiếp cận tốt hơn để sử dụng GAN sẽ là sử dụng trình phân loại được đào tạo trước như VGG-19 hoặc Inception v5, thay thế một vài lớp được kết nối đầy đủ cuối cùng và ổn điều chỉnh nó trên dữ liệu của bạn. Dưới đây là một ví dụ về việc sử dụng thư viện Keras trong Python - các ví dụ khác có thể được tìm thấy với các tìm kiếm như "tinh chỉnh phân loại hình ảnh CNN".
* GAN hiện đại đã tốt hơn kể từ khi tôi đăng câu trả lời này. Một nhóm nghiên cứu tại Nvidia đã thành công đáng kể khi tạo ra những bức ảnh chân thực 1024x1024 . Tuy nhiên, điều này không thay đổi các điểm khác trong câu trả lời của tôi. GAN không phải là nguồn hình ảnh đáng tin cậy cho các nhiệm vụ phân loại hình ảnh, ngoại trừ có thể cho các nhiệm vụ phụ của bất cứ điều gì GAN đã được đào tạo và có thể tạo điều kiện (hoặc có thể tầm thường hơn, để cung cấp dữ liệu nguồn cho các danh mục "khác" trong phân loại).