Làm cách nào để xác định số lượng toán tử tích chập trong CNN?


10

Trong tác vụ thị giác máy tính, chẳng hạn như phân loại đối tượng, với Mạng thần kinh chuyển đổi (CNN), mạng cung cấp một hiệu suất hấp dẫn. Nhưng tôi không chắc làm thế nào để thiết lập các tham số trong các lớp chập. Ví dụ, một ảnh thang độ xám ( 480x480), lớp chập đầu tiên có thể sử dụng toán tử chập như thế 11x11x10, trong đó số 10 có nghĩa là số toán tử chập.

Câu hỏi là làm thế nào để xác định số lượng toán tử tích chập trong CNN?

Câu trả lời:


11

Tôi giả sử rằng khi bạn nói 11x11x10bạn có nghĩa là bạn có một lớp với các bộ lọc 10, 11x11. Vì vậy, số lượng tích lũy mà bạn sẽ thực hiện chỉ đơn giản là 10, tích chập 2D cho mỗi bộ lọc trong ngân hàng bộ lọc của bạn. Vì vậy, hãy nói rằng bạn có một mạng:

480x480x1    # your input image of 1 channel
11x11x10     # your first filter bank of 10, 11x11 filters
5x5x20       # your second filter bank of 20, 5x5 filters
4x4x100      # your final filter bank of 100, 4x4 filters    

Bạn sẽ thực hiện: cấu 2D đa kênh mỗi kênh có độ sâu lần lượt là 1, 10 và 20. Như bạn có thể thấy, độ sâu của mỗi tích chập sẽ thay đổi như là một hàm của độ sâu của âm lượng đầu vào từ lớp trước.10+20+100=130

Nhưng tôi giả định rằng bạn đang cố gắng tìm ra cách so sánh điều này với một tích chập 2D kênh đơn. Chà, bạn chỉ có thể nhân độ sâu của từng khối lượng đầu vào với số lượng bộ lọc trong mỗi lớp và thêm chúng lại với nhau. Trong trường hợp của bạn: .10+200+2000=2,210

Bây giờ điều này chỉ cho bạn biết có bao nhiêu đơn kênh 2D nhiều nếp cuộn bạn đang làm, không phải là cách tính toán chuyên sâu từng chập là, cường độ tính toán của từng chập sẽ phụ thuộc vào một loạt các thông số bao gồm image_size, image_depth, filter_size, bạn stride(bao xa bạn bước giữa từng cá nhân tính toán bộ lọc), số lớp gộp bạn có, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.