Sự khác biệt giữa Inception v2 và Inception v3 là gì?


18

Bài viết đi sâu hơn với các kết luận mô tả GoogleNet có chứa các mô-đun khởi đầu ban đầu:

nhập mô tả hình ảnh ở đây

Sự thay đổi đối với sự khởi đầu v2 là họ đã thay thế các cấu trúc 5x5 bằng hai cấu trúc 3x3 liên tiếp và gộp chung:

nhập mô tả hình ảnh ở đây

Sự khác biệt giữa Inception v2 và Inception v3 là gì?


Nó chỉ đơn giản là bình thường hóa hàng loạt? Hay Inception v2 đã có chuẩn hóa hàng loạt?
Martin Thoma

github.com/SKKSaikia/CNN-GoogLeNet Kho lưu trữ này chứa tất cả các phiên bản của GoogLeNet và sự khác biệt của chúng. Hãy thử một lần.
Amartya Ranjan Saikia

Câu trả lời:


22

Trong bài viết Batch bình thường hóa , Serge et al, 2015. kiến trúc Inception-v1 được đề xuất là một biến thể của GoogleNet trong bài viết Đi sâu hơn với các kết luận và trong khi đó, họ đã giới thiệu Batch bình thường hóa thành Inception (BN-Inception).

Sự khác biệt chính đối với mạng được mô tả trong (Szegedy et al., 2014) là các lớp chập 5x5 được thay thế bằng hai lớp liên tiếp 3x3 với tối đa 128 bộ lọc.

Và trong bài viết Xem xét lại Kiến trúc khởi động cho tầm nhìn máy tính , các tác giả đã đề xuất Inception-v2 và Inception-v3.

Trong Inception-v2 , họ đã giới thiệu Factorization (nhân tố hóa các cấu trúc thành các cấu trúc nhỏ hơn) và một số thay đổi nhỏ thành Inception-v1.

Lưu ý rằng chúng tôi đã tính hệ số tích phân 7x7 truyền thống thành ba tổ hợp 3x3

Đối với Inception-v3 , nó là một biến thể của Inception-v2 có thêm BN-phụ trợ.

BN phụ đề cập đến phiên bản trong đó lớp được kết nối đầy đủ của phân loại phụ trợ cũng được chuẩn hóa, không chỉ là kết cấu. Chúng tôi đang đề cập đến mô hình [Inception-v2 + BN phụ] là Inception-v3.


3

bên cạnh những gì được đề cập bởi daoliker

khởi đầu v2 sử dụng tích chập có thể tách rời làm lớp đầu tiên của độ sâu 64

trích dẫn từ giấy

Mô hình của chúng tôi sử dụng tích chập có thể tách rời với hệ số nhân độ sâu 8 trên lớp chập đầu tiên. Điều này giúp giảm chi phí tính toán trong khi tăng mức tiêu thụ bộ nhớ tại thời điểm đào tạo.

tại sao điều này lại quan trọng bởi vì nó đã bị loại bỏ trong v3 và v4 và resnet khởi động, nhưng được giới thiệu lại và sử dụng nhiều trong Mobilenet sau đó.


1

Câu trả lời có thể được tìm thấy trong phần Đi sâu hơn với giấy xác nhận: https://arxiv.org/pdf/1512.00567v3.pdf

Kiểm tra Bảng 3. Inception v2 là kiến ​​trúc được mô tả trong phần Đi sâu hơn với giấy kết cấu. Inception v3 là cùng một kiến ​​trúc (những thay đổi nhỏ) với thuật toán đào tạo khác nhau (RMSprop, bộ làm mịn nhãn, thêm một đầu phụ với định mức hàng loạt để cải thiện đào tạo, v.v.).


1

Trên thực tế, các câu trả lời ở trên dường như là sai. Thật vậy, đó là một mớ hỗn độn lớn với việc đặt tên. Tuy nhiên, dường như nó đã được sửa trong bài báo giới thiệu Inception-v4 (xem: "Inception-v4, Inception-ResNet và tác động của kết nối dư thừa đối với việc học"):

Kiến trúc tích chập sâu Inception được giới thiệu là GoogLeNet trong (Szegedy et al. 2015a), ở đây có tên Inception-v1. Sau đó, kiến ​​trúc Inception được cải tiến theo nhiều cách khác nhau, đầu tiên là bằng cách giới thiệu chuẩn hóa hàng loạt (Ioffe và Szegedy 2015) (Inception-v2). Sau đó, bằng các ý tưởng nhân tố bổ sung trong lần lặp thứ ba (Szegedy et al. 2015b) sẽ được gọi là Inception-v3 trong báo cáo này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.