Tôi đang cố gắng để hiểu phần tích chập của mạng nơ ron tích chập. Nhìn vào hình sau:
Tôi không có vấn đề gì trong việc hiểu lớp chập đầu tiên trong đó chúng ta có 4 hạt nhân khác nhau (có kích thước ), chúng ta kết hợp với hình ảnh đầu vào để có được 4 bản đồ đặc trưng.
Điều tôi không hiểu là lớp tích chập tiếp theo, nơi chúng ta đi từ 4 bản đồ đặc trưng đến 6 bản đồ đặc trưng. Tôi giả sử chúng ta có 6 hạt nhân trong lớp này (do đó đưa ra 6 bản đồ tính năng đầu ra), nhưng làm thế nào để các hạt nhân này hoạt động trên 4 bản đồ tính năng được hiển thị trong C1? Là các hạt nhân 3 chiều, hay chúng là 2 chiều và được nhân rộng trên 4 bản đồ tính năng đầu vào?