Tôi khá mới đối với các mạng thần kinh, nhưng tôi hiểu đại số tuyến tính và toán học về tích chập khá rõ ràng.
Tôi đang cố gắng để hiểu mã ví dụ mà tôi tìm thấy ở nhiều nơi trên mạng để đào tạo một NN tích chập Keras với dữ liệu MNIST để nhận dạng các chữ số. Kỳ vọng của tôi sẽ là khi tôi tạo một lớp chập, tôi sẽ phải chỉ định một bộ lọc hoặc bộ bộ lọc để áp dụng cho đầu vào. Nhưng ba mẫu tôi đã tìm thấy tất cả tạo ra một lớp chập như thế này:
model.add(Convolution2D(nb_filter = 32, nb_row = 3, nb_col = 3,
border_mode='valid',
input_shape=input_shape))
Điều này dường như đang áp dụng tổng cộng 32 bộ lọc 3x3 cho các hình ảnh được xử lý bởi CNN. Nhưng những bộ lọc đó là gì? Làm thế nào tôi có thể mô tả chúng về mặt toán học? Các tài liệu keras là không giúp đỡ.
Cảm ơn trước,