Có thể đào tạo mạng lưới thần kinh để vẽ hình theo một phong cách nhất định?


10

Có thể đào tạo mạng lưới thần kinh để vẽ hình theo phong cách nhất định? (Vì vậy, nó lấy một hình ảnh và vẽ lại theo phong cách mà nó đã được đào tạo.)

Có bất kỳ công nghệ được phê duyệt cho loại điều đó? Tôi biết về thuật toán DeepArt. Thật tốt khi điền vào hình ảnh chính với một số mẫu nhất định (ví dụ: hình ảnh vangoghify), nhưng tôi đang tìm kiếm một cái gì đó khác biệt - ví dụ, làm phim hoạt hình theo một phong cách nhất định từ chân dung đầu vào.


3
Một trở ngại để đào tạo một mạng lưới thần kinh từ hình ảnh đến phim hoạt hình có thể là tìm kiếm một bộ dữ liệu đào tạo. Có vẻ như bộ dữ liệu sẽ phải chứa các bức ảnh và phim hoạt hình mà con người đã vẽ dựa trên những bức ảnh đó. Tôi không biết bất kỳ bộ dữ liệu như vậy.
Tanner Swett

@TannerSwett Bạn nghĩ bao nhiêu hình ảnh là cần thiết cho loại đào tạo như vậy?
zavg

Tôi không phải là chuyên gia, vì vậy tôi chỉ có thể đoán. Tôi nghĩ bạn sẽ cần ít nhất một ngàn hình ảnh. Bạn có thể cần nhiều hơn thế. Nhân tiện, tôi khuyên bạn nên xem công cụ này: github.com/hardmaru/sketch-rnn Công cụ đó đã được sử dụng để tạo mô phỏng các ký tự Trung Quốc; có lẽ một công cụ tương tự có thể tạo ra mô phỏng của phim hoạt hình.
Tanner Swett

Tôi có thể hơi lạc hậu vì cách đào tạo NN của tôi cách đây một thời gian nhưng nếu bạn đang nghĩ đến việc chỉ đào tạo một mạng lưới với vài nghìn hình ảnh và hy vọng nó có thể hiển thị hình ảnh theo phong cách mà bạn có thể đạt được quá xa - nếu bạn đang nghĩ rằng đây là một dự án khởi đầu tốt thì không. Để đạt được những gì bạn mô tả sẽ cần rất nhiều 'thủ công'. Hãy suy nghĩ về kiến ​​thức cần thiết để diễn giải một hình ảnh và không chỉ là mẫu phù hợp.
Peter Scott

Câu trả lời:


12

Có một bài báo liên quan: LA Gatus, AS Ecker, M Bethge, 2015, Thuật toán thần kinh của phong cách nghệ thuật . Trích dẫn từ trừu tượng,

Ở đây chúng tôi giới thiệu một hệ thống nhân tạo dựa trên Mạng lưới thần kinh sâu tạo ra hình ảnh nghệ thuật có chất lượng cảm nhận cao. Hệ thống sử dụng các biểu diễn thần kinh để phân tách và kết hợp lại nội dung và phong cách của các hình ảnh tùy ý, cung cấp một thuật toán thần kinh để tạo ra các hình ảnh nghệ thuật.

Đây là Hình 2 từ bài báo này:

nhập mô tả hình ảnh ở đây

Ngoài ra còn có một triển khai nguồn mở rất phổ biến dựa trên đèn pin ở đây khá dễ sử dụng. Xem liên kết để biết thêm ví dụ.

Hãy nhớ rằng các tính toán rất nặng và do đó việc xử lý các ảnh đơn là phạm vi của công việc này.

Chỉnh sửa: sau khi kiểm tra dự án DeepArt đã đề cập của bạn, có vẻ như nó đang sử dụng các kỹ thuật tương tự. Tôi không chắc tại sao đây không phải là điều bạn muốn, bởi vì khái niệm chuyển kiểu là chung chung như nó có.


4
Phim hoạt hình phóng đại và đơn giản hóa các tính năng của bất cứ thứ gì chúng được mô tả, tạo ra các hình dạng rất giống với các hình dạng trong một bức ảnh. Tôi không tin rằng mạng lưới thần kinh chuyển kiểu hiện tại đã từng làm điều đó.
Tanner Swett

@TannerSwett Xem các ví dụ ở đây: imgur.com/a/ue6ap . Một số trong số họ là khá hoạt hình-ish.
amip nói rằng Phục hồi Monica

@amoeba Họ trông có vẻ hoạt hình, vâng, nhưng không ai trong số họ có tỷ lệ méo mó mà hầu hết các phim hoạt hình thực sự có.
Tanner Swett

Chúng ta đang nói về chuyển phong cách ở đây. Tất cả các ví dụ sử dụng một số phong cách được chọn trước, trong đó không phải là kiểu hoạt hình (tại sao đầu ra phải trông hoạt hình, khi nó học trên Van Gogh). Có lẽ bạn chỉ có thể chạy dự án nguồn mở (tôi không gặp vấn đề gì trong quá khứ) và thử nó với đầu vào hoạt hình.
sascha

7

Đây là một vấn đề khá khó giải quyết. Bạn có thể xem một số ví dụ ở đây về cách một phong cách hoạt hình, ví dụ từ Simpson đã được áp dụng cho một hình ảnh.

Một hình ảnh hoạt hình thường không có cấu trúc mang lại hiệu ứng nghệ thuật này . Cách dễ nhất để thử áp dụng điều này theo một cách nào đó là có một trình theo dõi khuôn mặt, và sau đó cố gắng căn chỉnh hai khuôn mặt, ví dụ như khuôn mặt hoạt hình và khuôn mặt người, sau đó áp dụng điều này. Điều đó có thể đưa bạn đến một nơi nào đó, nhưng nó cũng có thể trông kỳ lạ. Sau đó, bạn có thể chú thích các mốc trong hình ảnh để giúp thêm và thực hiện đăng ký không cứng nhắc trước đó. Đây vẫn là một giải pháp shitmix, nhưng gần nhất tôi có thể nghĩ rằng nó có thể làm việc cho khuôn mặt.

Biên tập:

Nhận xét của @TannerSwett thêm điều gì đó vào đây, có khả năng truy cập vào một số trang web của các nghệ sĩ và cố gắng tìm minh họa của họ và cố gắng tìm hiểu phong cách "của họ". Tôi vẫn không nghĩ rằng sẽ thỏa đáng hoặc mang lại đủ dữ liệu, nhưng đó sẽ là một điều thú vị để thử nghiệm. Hiện tại không có giải pháp khả dụng, nhưng tôi nghĩ rằng chắc chắn một số người đang làm việc này và chúng tôi sẽ sớm thấy kết quả tốt hơn.

Tôi nghĩ rằng có lẽ con đường để đi không phải là cách tiếp cận mạng lưới thần kinh nghệ thuật. Có lẽ tốt hơn là có một mạng có thể phân loại các đối tượng trong một hình ảnh và sau đó tìm hiểu sự tương ứng giữa các đối tượng và các đối tác hoạt hình của chúng, sau đó pha trộn các kết quả theo một cách có ý nghĩa.


1
Ví dụ Simpson đó có vẻ khá tuyệt vời đối với tôi @Gumeo
FabricioG

1

Nó không quá phức tạp để làm. Không đọc bài báo được đề cập, đây là công thức của tôi:

Bộ mã hóa tự động biến đổi

Bản demo trực tuyến với khuôn mặt biến hình: http://vdumoulin.github.io/morphing_faces/online_demo.html

https://jmetzen.github.io/2015-11-27/vae.html cho teh codez.

Về cơ bản, điều này cung cấp cho bạn một cách để tối ưu hóa 'phong cách' trong trường hợp của bạn, ví dụ, hãy nói rằng nét cọ rộng hay mờ như thế nào. Những thứ phụ thuộc vào phong cách cụ thể mà bạn đang cố gắng thi đua.

Trong ví dụ trên, các mặt 'biến hình' hoặc 'tưởng tượng' khác nhau là một hàm của các tham số trong không gian tiềm ẩn. Trong hình ảnh dưới đây sẽ là những gì bạn nhận được bằng cách thay đổi công cụ ở cấp độ 'mã'.

Đây là ý tưởng cơ bản: hình ảnh gốc bên trái, phiên bản cách điệu của cùng một hình ảnh bên phải:

nhập mô tả hình ảnh ở đây

Bây giờ, về mặt lý thuyết, nếu bạn huấn luyện một mô hình như vậy trên một hình ảnh bình thường và một hình ảnh cách điệu làm mục tiêu và thêm các kết cấu, bạn sẽ có thể tìm hiểu các bộ lọc hạt nhân tương ứng với loại "nét cọ" mà nghệ sĩ sử dụng .

Tất nhiên, điều đó có nghĩa là bạn cần phải có một vài ví dụ về hình ảnh ở cả phiên bản gốc và cách điệu. Một bộ dữ liệu như vậy sẽ rất tuyệt khi quyên góp cho cộng đồng - nếu bạn kết thúc việc này, tôi rất muốn xem loại công việc này.

Chúc may mắn!

Bài viết wiki về bộ mã hóa tự động sẽ là điểm khởi đầu tốt: https://en.wikipedia.org/wiki/Autoencoder

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.