Trong các mạng nơ ron tích chập (CNN), ma trận các trọng số ở mỗi bước sẽ được lật các hàng và cột để lấy ma trận hạt nhân, trước khi tiến hành tích chập. Điều này được giải thích trên một loạt các video của Hugo Larochelle tại đây :
Việc tính toán các bản đồ ẩn sẽ tương ứng với việc thực hiện tích chập rời rạc với một kênh từ lớp trước, sử dụng ma trận hạt nhân [...] và hạt nhân đó được tính từ ma trận trọng số ẩn , trong đó chúng ta lật các hàng và cột.
Nếu chúng ta so sánh các bước giảm của phép tích chập với phép nhân ma trận thông thường như trong các loại NN khác, thì phương tiện sẽ là một lời giải thích rõ ràng . Tuy nhiên, đây có thể không phải là so sánh thích hợp nhất ...
Trong xử lý hình ảnh kỹ thuật số, việc áp dụng tích chập bộ lọc vào hình ảnh ( đây là một video youtube tuyệt vời cho trực giác thực tế ) dường như có liên quan đến:
- Thực tế là tích chập là kết hợp trong khi tương quan (chéo) thì không.
- Khả năng áp dụng các bộ lọc trong miền tần số của hình ảnh dưới dạng phép nhân, vì tích chập trong miền thời gian tương đương với phép nhân trong miền tần số ( định lý tích chập ).
Trong môi trường kỹ thuật đặc biệt này của tương quan DSP được định nghĩa là:
về cơ bản là tổng của tất cả các ô trong sản phẩm Hadamard:
Trong đó là hàm lọc (được biểu thị dưới dạng ma trận) và I ( x , y ) là giá trị pixel của ảnh tại vị trí ( x , y ) :
Các mục tiêu của tương quan chéo là để đánh giá mức độ tương tự như là một hình ảnh thăm dò để một hình ảnh thử nghiệm. Việc tính toán một bản đồ tương quan chéo dựa trên định lý tích chập.
Mặt khác, tích chập được định nghĩa là:
miễn là bộ lọc đối xứng, nó giống như một hoạt động tương quan với các hàng và cột của bộ lọc được lật:
Tính toán, cả hai hoạt động là một sản phẩm bên trong Frobenius, tính toán để theo dõi phép nhân của ma trận .
Câu hỏi (cải cách sau khi nhận xét và trả lời đầu tiên):
- Việc sử dụng các cấu trúc trong CNN có liên quan đến FFT không?
Từ những gì tôi thu thập được cho đến nay câu trả lời là không. Các FFT đã được sử dụng để tăng tốc độ triển khai GPU của các kết cấu . Tuy nhiên, FFT thường không phải là một phần của cấu trúc hoặc chức năng kích hoạt trong CNN, mặc dù việc sử dụng các cấu trúc trong các bước kích hoạt trước.
- Là tích chập và tương quan chéo trong CNN tương đương?
Vâng, chúng là tương đương.
- Nếu nó đơn giản là "không có sự khác biệt", thì điểm nào để lật các trọng số vào ma trận hạt nhân?
Không phải sự kết hợp của tích chập (hữu ích trong chứng minh toán học), cũng không có bất kỳ cân nhắc nào liên quan đến FT và định lý tích chập được áp dụng. Trên thực tế, có vẻ như việc lật không thậm chí diễn ra (mối tương quan chéo đơn giản là bị gắn nhãn sai là tích chập) (?).