Những gì VG VG VG54 và VG VGG22 bắt nguồn từ VGG19 CNN là gì?


9

Trong bài báo Siêu phân giải hình ảnh đơn thực tế bằng cách sử dụng Mạng đối thủ tạo của Christian Ledig và cộng sự, khoảng cách giữa các hình ảnh (được sử dụng trong chức năng mất) được tính từ các bản đồ đặc trưng được trích xuất từ ​​mạng VGG19. Hai cái được sử dụng trong bài viết là (hơi khó hiểu) được gọi là VGG22 và VGG54.

Những bản đồ đặc trưng này là gì?

Ký hiệu "22" và "54" nghĩa là gì?


19 là số lớp. Có lẽ phần còn lại có nghĩa là như nhau?
Alex

Nếu chỉ đơn giản như vậy ... ;-) Đây là các chỉ định ánh xạ từ VGG19, không phải là mạng theo cách riêng của họ.
Lafayette

Tôi không bao giờ đọc báo. Đây là điều đầu tiên tôi nghĩ đến khi tôi nhìn thấy từ viết tắt.
Alex

Giả định của bạn thực sự hợp lý, nhưng họ nói rằng đó không phải là trường hợp, chỉ có mạng VGG19 được sử dụng.
Lafayette

Câu trả lời:


3

Đọc bài viết, có vẻ như họ định nghĩa VGG54 là tổn thất được tính từ khoảng cách euclide giữa các bản đồ tính năng xuất phát từ cả hình ảnh có độ phân giải cao và thấp sử dụng mạng VGG19. Trong đó được định nghĩa là " bản đồ đặc trưng thu được từ tích chập thứ j (sau khi kích hoạt) và trước lớp tổng hợp tối đa thứ i trong mạng VGG19 ".ϕ5,4ϕi,j


Tôi cho rằng điều tương tự cũng đúng với VGG22 - nghĩa là, tổn thất được tính từ ϕ2,2. Có đúng không?
Sảnh

1
Điều đó đúng :)
Carlos S. Na

1
Bạn có thể giải thích rõ hơn về "bản đồ tính năng thu được từ tích chập thứ j (sau khi kích hoạt) và trước lớp tổng hợp tối đa thứ i trong mạng VGG19" không? có nghĩa là lớp trước lớp tối đa phải không? Nhưng lớp có rất nhiều bộ lọc (tôi nghĩ 512). Vì vậy, chúng tôi sẽ có 512 không gian tính năng. Chọn cái nào trong số này? Ngoài ra "sau khi kích hoạt" có nghĩa là gì? ϕ5,44th5th4th
Nagabhushan SN
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.