Sự khác biệt giữa các lớp Conv và FC?


Câu trả lời:


12

Một lớp chập áp dụng cùng một bộ lọc (thường là nhỏ) lặp đi lặp lại ở các vị trí khác nhau trong lớp bên dưới nó. Ví dụ: nếu lớp đầu vào có kích thước 512 x 512, bạn có thể có lớp đối lưu áp dụng cùng bộ lọc 8 x 8 (được chỉ định bởi 64 hệ số bộ lọc), tại mỗi điểm trong (ví dụ) lưới 128 x 128 được phủ lên trên lớp đầu vào . Mặt khác, mỗi nút trong một lớp được kết nối đầy đủ sẽ học được các trọng số 512 x 512, một cho mỗi nút trong lớp đầu vào.

Do đó, các lớp conv rất phù hợp để phát hiện các tính năng cục bộ có thể xuất hiện ở bất kỳ đâu trong đầu vào (ví dụ: các cạnh trong hình ảnh trực quan). Ý tưởng là bạn không phải đào tạo từng nút riêng biệt để phát hiện cùng một tính năng, mà là bạn học một bộ lọc được chia sẻ giữa tất cả các nút.

(Lưu ý rằng mỗi lớp đối lưu thường học một tập hợp nhiều bộ lọc, mỗi bộ lọc được áp dụng lặp đi lặp lại trên đầu vào. Ví dụ: nếu lớp đối lưu học 16 tính năng khác nhau, nó được gọi là có 'độ sâu' là 16).

Các lớp FC được sử dụng để phát hiện các cấu hình toàn cầu cụ thể của các tính năng được phát hiện bởi các lớp thấp hơn trong mạng. Họ thường ngồi ở đầu phân cấp mạng, tại thời điểm đầu vào đã bị giảm (bởi các lớp trước, thường là chập) thành một biểu diễn nhỏ gọn của các tính năng. Mỗi nút trong lớp FC học tập trọng số riêng của mình trên tất cả các nút trong lớp bên dưới nó.

Vì vậy, bạn có thể (đại khái) nghĩ về các lớp đối lưu như phá vỡ đầu vào (ví dụ như hình ảnh) thành các tính năng phổ biến và các lớp FC khi ghép các tính năng đó lại với nhau thành các đối tượng mà bạn muốn mạng nhận ra.


Tại sao lưới 128x128, nó phụ thuộc vào sải chân và đệm.
Łukasz Tốt nghiệp

1
Đúng, 128 x 128 chỉ là một ví dụ (đã chỉnh sửa câu trả lời của tôi để làm rõ).
Ruben van Bergen

Nơi nào để biết chúng ta phải có bao nhiêu bộ lọc?
MiniMax

Độc đáo bằng văn bản cho ngay cả một người đàn ông dân trong lĩnh vực này, như tôi ..
tod

0

Bạn có thể sử dụng các lớp đối lưu thay vì FC. Tuy nhiên, do tính chất của các lớp đối lưu nơi chia sẻ trọng số, sẽ có ít tham số hơn. Nó có thể khiến mạng của bạn có thể không đủ khả năng để tìm hiểu nội dung. Nhưng tất cả phụ thuộc vào mạng của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.