Tại sao thế hệ của hình ảnh phong cách sâu rất chậm và đói tài nguyên?


7

Hãy xem xét các thuật toán phong cách thần kinh tạo ra một số tác phẩm nghệ thuật:

Tại sao việc tạo ra những hình ảnh như vậy rất chậm và tại sao nó lại chiếm một lượng lớn bộ nhớ? Không có phương pháp tối ưu hóa thuật toán?

Cơ chế hoặc giới hạn kỹ thuật đằng sau này là gì? Tại sao chúng ta không thể xử lý thời gian thực?

Dưới đây là một vài bình luận của người dùng ( Làm thế nào MỌI NGƯỜI có thể tạo hình ảnh Deep Style ):

  • Bất cứ điều gì trên 640x480 và chúng ta đang nói về những ngày khủng hoảng nặng nề và một lượng ram điên rồ.

  • Tôi đã thử thực hiện một hình ảnh 1024pixel và nó vẫn bị lỗi với bộ nhớ 14gigs và trao đổi 26gigs. Vì vậy, hầu hết không gian VM chỉ là hoán đổi. Thêm vào đó phải mất vài giờ khả năng cpu kết xuất này.

  • Tôi đã thử 1024x768 và với 16gig ram và 20+ gig exchange, nó vẫn chết vì thiếu bộ nhớ.

  • Có một vấn đề bộ nhớ, mặc dù. Tôi đang sử dụng loại đối tượng "g2.8xlarge".

Câu trả lời:


3

Chuyển đổi phong cách thời gian thực và vẽ nguệch ngoạc thần kinh là rất nhiều có thể và là một chủ đề tích cực tôi thấy người dùng đang làm việc để cải thiện. Ý tưởng cơ bản là chỉ thực hiện truyền lan trong thời gian thử nghiệm và đào tạo với các chức năng mất thích hợp tại thời gian đào tạo.

Mất mát về nhận thức đối với việc chuyển đổi phong cách thời gian thực và độ phân giải siêu cao là điểm khởi đầu tốt để hiểu một phương pháp cho mục đích này.


2

Đó là một quá trình thâm dụng lao động, nhưng điều đó nghe có vẻ quá mức. Nếu bạn có g2.8xlarge, hãy đảm bảo rằng bạn đang sử dụng cờ GPU cho kiểu thần kinh, điều này sẽ cắt thời gian kết xuất của bạn theo một độ lớn.

Điều đó đã được nói, nó đang xây dựng một mạng khá lớn (tùy thuộc vào thông số của bạn) và hình ảnh 1024x768 là rất nhiều đầu vào để làm việc. Sẽ mất thời gian, nhưng không nên mất hơn một vài giờ với cờ GPU được bật chính xác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.