Tôi giả sử rằng khi bạn nói 11x11x10
bạn có nghĩa là bạn có một lớp với các bộ lọc 10, 11x11. Vì vậy, số lượng tích lũy mà bạn sẽ thực hiện chỉ đơn giản là 10, tích chập 2D cho mỗi bộ lọc trong ngân hàng bộ lọc của bạn. Vì vậy, hãy nói rằng bạn có một mạng:
480x480x1 # your input image of 1 channel
11x11x10 # your first filter bank of 10, 11x11 filters
5x5x20 # your second filter bank of 20, 5x5 filters
4x4x100 # your final filter bank of 100, 4x4 filters
Bạn sẽ thực hiện: cấu 2D đa kênh mỗi kênh có độ sâu lần lượt là 1, 10 và 20. Như bạn có thể thấy, độ sâu của mỗi tích chập sẽ thay đổi như là một hàm của độ sâu của âm lượng đầu vào từ lớp trước.10 + 20 + 100 = 130
Nhưng tôi giả định rằng bạn đang cố gắng tìm ra cách so sánh điều này với một tích chập 2D kênh đơn. Chà, bạn chỉ có thể nhân độ sâu của từng khối lượng đầu vào với số lượng bộ lọc trong mỗi lớp và thêm chúng lại với nhau. Trong trường hợp của bạn: .10 + 200 + 2000 = 2 , 210
Bây giờ điều này chỉ cho bạn biết có bao nhiêu đơn kênh 2D nhiều nếp cuộn bạn đang làm, không phải là cách tính toán chuyên sâu từng chập là, cường độ tính toán của từng chập sẽ phụ thuộc vào một loạt các thông số bao gồm image_size
, image_depth
, filter_size
, bạn stride
(bao xa bạn bước giữa từng cá nhân tính toán bộ lọc), số lớp gộp bạn có, v.v.