GAN có thể được sử dụng để tăng dữ liệu không?


9

Mạng đối thủ chung (GAN) có thể được sử dụng để tăng dữ liệu (nghĩa là để tạo các ví dụ tổng hợp được thêm vào tập dữ liệu) không? Nó có ảnh hưởng gì đến hiệu suất của một mô hình được đào tạo trên bộ dữ liệu tăng cường không?


1
Chỉ từ góc độ lý thuyết thôi, điều này là không thể. Nếu một GAN được đào tạo trên một tập dữ liệu nhất định, nó chỉ có thể tìm hiểu thông tin được thể hiện trong tập dữ liệu đó. Nếu sau đó bạn sử dụng GAN này để tạo dữ liệu mới, nó sẽ tạo dữ liệu từ cùng một không gian có dữ liệu gốc. Bằng cách đào tạo GAN, bạn không thêm bất kỳ thông tin mới nào vào tập dữ liệu, do đó, GAN không thể tạo dữ liệu từ một không gian lớn hơn không gian của tập dữ liệu gốc. Do đó, thật vô nghĩa khi cố gắng tạo dữ liệu đào tạo mới bằng GAN, vì dữ liệu tổng hợp này sẽ không chứa bất kỳ thông tin mới nào.
Alex

3
Tôi không hiểu tại sao câu hỏi này đã bị đóng. Câu hỏi thực sự rất thú vị. Tôi muốn thêm một liên kết đến một nghiên cứu chúng tôi thực hiện liên quan đến vấn đề này, nếu có ai quan tâm. Các mã có liên quan có thể được tìm thấy ở đây .
Djib2011

Tôi đồng ý. cảm ơn vì đã mở lại Bạn có thể mô tả nghiên cứu của bạn như là một câu trả lời?
ErroriSalvo

Câu trả lời:


10

Có, GAN có thể được sử dụng để "ảo giác" dữ liệu bổ sung dưới dạng một hình thức tăng dữ liệu.

Xem những giấy tờ này làm khá nhiều những gì bạn đang yêu cầu:

Nếu GAN của bạn được đào tạo đầy đủ, không có lý do nào điều này không giúp cải thiện hiệu suất mô hình. Nếu GAN của bạn xấu, bạn sẽ nhận được rác.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.