Giới thiệu nền
Trong một mạng nơ ron tích chập, chúng ta thường có một cấu trúc / luồng chung trông như thế này:
- hình ảnh đầu vào (tức là một vectơ 2D
x
)
(Lớp kết hợp đầu tiên (Conv1) bắt đầu tại đây ...)
- kết hợp một bộ các bộ lọc (
w1
) dọc theo hình ảnh 2D (nghĩa làz1 = w1*x + b1
nhân các sản phẩm chấm), trong đóz1
là 3D vàb1
là các thiên vị. - áp dụng chức năng kích hoạt (ví dụ ReLu) để tạo
z1
phi tuyến tính (ví dụa1 = ReLu(z1)
), trong đóa1
là 3D.
(Lớp kết hợp thứ 2 (Conv2) bắt đầu từ đây ...)
- kết hợp một bộ các bộ lọc dọc theo các kích hoạt mới được tính toán (nghĩa là
z2 = w2*a1 + b2
nhân các sản phẩm chấm), trong đóz2
là 3D vàb2
là các thiên vị. - áp dụng chức năng kích hoạt (ví dụ ReLu) để tạo
z2
phi tuyến tính (ví dụa2 = ReLu(z2)
), trong đóa2
là 3D.
Câu hỏi
Định nghĩa của thuật ngữ "bản đồ đặc trưng" dường như thay đổi từ văn học sang văn học. Cụ thể:
- Đối với lớp chập thứ nhất, "bản đồ đặc trưng" có tương ứng với vectơ đầu vào
x
, hoặc sản phẩm chấm đầu raz1
, hoặc kích hoạt đầu raa1
hoặc "quá trình" chuyển đổix
thànha1
, hoặc một cái gì khác không? - Tương tự, đối với lớp chập thứ 2, "bản đồ đặc trưng" có tương ứng với các kích hoạt đầu vào
a1
, hoặc sản phẩm chấm đầu raz2
, hoặc kích hoạt đầu raa2
, hoặc "quá trình" chuyển đổia1
thànha2
, hoặc một cái gì khác không?
Ngoài ra, có đúng là thuật ngữ "bản đồ đặc trưng" hoàn toàn giống với "bản đồ kích hoạt" không? (hoặc họ thực sự có nghĩa là hai điều khác nhau?)
Tham khảo thêm:
Đoạn trích từ Mạng lưới thần kinh và Học sâu - Chương 6 :
* Danh pháp đang được sử dụng một cách lỏng lẻo ở đây. Cụ thể, tôi đang sử dụng "bản đồ đặc trưng" để có nghĩa không phải là chức năng được tính toán bởi lớp chập, mà là kích hoạt đầu ra của các nơ-ron ẩn từ lớp. Loại lạm dụng danh pháp nhẹ này là khá phổ biến trong các tài liệu nghiên cứu.
Đoạn trích từ trực quan hóa và hiểu các mạng kết hợp của Matt Zeiler :
Trong bài báo này, chúng tôi giới thiệu một kỹ thuật trực quan cho thấy các kích thích đầu vào kích thích các bản đồ đặc trưng riêng lẻ ở bất kỳ lớp nào trong mô hình. [...] Ngược lại, cách tiếp cận của chúng tôi cung cấp một cái nhìn không tham số về tính bất biến, cho thấy các mẫu từ tập huấn luyện kích hoạt bản đồ tính năng. [...] một hoạt động tương phản cục bộ giúp bình thường hóa các phản hồi trên các bản đồ tính năng. [...] Để kiểm tra một kích hoạt mạng lưới đã cho, chúng tôi đặt tất cả các kích hoạt khác trong lớp thành 0 và chuyển các ánh xạ tính năng làm đầu vào cho lớp deconvnet đính kèm. [...] Mạng lưới sử dụng phi tuyến tính, điều chỉnh các bản đồ đặc trưng, do đó đảm bảo các bản đồ tính năng luôn dương. [...] Mạng lưới sử dụng các bộ lọc đã học để kết hợp các bản đồ tính năng từ lớp trước. [...] Hình 6, những hình ảnh này là các biểu diễn chính xác của mẫu đầu vào kích thích sơ đồ tính năng đã cho trong mô hình [...] khi các phần của hình ảnh đầu vào ban đầu tương ứng với mẫu bị che khuất, chúng tôi thấy hoạt động giảm rõ rệt trong bản đồ tính năng. [...]
Lưu ý: cũng giới thiệu thuật ngữ "bản đồ đặc trưng" và "bản đồ tính năng được chỉnh sửa" trong Hình 1.
Đoạn trích từ Chương Stanford CS231n trên CNN :
[...] Một cạm bẫy nguy hiểm có thể dễ dàng nhận thấy với hình dung này là một số bản đồ kích hoạt có thể bằng 0 đối với nhiều đầu vào khác nhau, có thể chỉ ra các bộ lọc chết và có thể là triệu chứng của tỷ lệ học tập cao [...] Các kích hoạt trông điển hình trên lớp CONV đầu tiên (trái) và lớp CONV thứ 5 (phải) của AlexNet được đào tạo nhìn vào hình ảnh của một con mèo. Mỗi hộp hiển thị một bản đồ kích hoạt tương ứng với một số bộ lọc. Lưu ý rằng các kích hoạt rất thưa thớt (hầu hết các giá trị đều bằng 0, trong hình ảnh này được hiển thị bằng màu đen) và chủ yếu là cục bộ.
Đoạn trích từ A-Begin's-Guide-To-Hiểu-Convolutional-Neural-Networks
[...] Mỗi vị trí duy nhất trên khối lượng đầu vào sẽ tạo ra một số. Sau khi trượt bộ lọc trên tất cả các vị trí, bạn sẽ thấy rằng những gì bạn còn lại là một dãy số 28 x 28 x 1, chúng tôi gọi là bản đồ kích hoạt hoặc bản đồ đặc trưng.
a1
,a2
v.v.). Trong Conv2, tôi đoán tôi sẽ gọia1
bản đồ kích hoạt đầu vào vàa2
bản đồ kích hoạt đầu ra. Trong Conv1, tôix
là hình ảnh đầu vào vàa1
bản đồ kích hoạt đầu ra.