Kích thước đầu ra của tích chập trong học tập sâu phụ thuộc vào nhiều yếu tố
- kích thước của bộ lọc (còn gọi là kernel)
- phần đệm (cho dù bạn thêm số không hay không xung quanh hình ảnh của bạn và bao nhiêu)
- số lượng bộ lọc mà bạn sử dụng
- sải chân
Sự phụ thuộc đơn giản nhất là vào số lượng bộ lọc N
. Nó cung cấp cho bạn số lượng bản đồ tính năng mà đầu ra của bạn có. Đối với đầu vào có thể là các kênh RGB tức là 3, đối với đầu ra, số này có thể được chọn tự do.
Yếu tố tiếp theo là không đệm. Nếu bạn sử dụng kích thước bộ lọc là (3,3) và phần đệm "hợp lệ", tức là thêm KHÔNG số 0 xung quanh hình ảnh, bạn sẽ có đầu ra là thứ nguyên.
(100, 100, 3) -> (98, 98, N)
Bởi vì bạn sử dụng sải chân là 1. Nếu bạn di chuyển bộ lọc qua hình ảnh ở cuối hình ảnh theo mỗi hướng, bộ lọc sẽ chạm đường viền sau 98 bước.
Tuy nhiên, nếu bạn sử dụng phần đệm "CÙNG", bạn sẽ bù cho kích thước bộ lọc - trong trường hợp kích thước bộ lọc là (3,3) tương ứng với một dòng số không xung quanh hình ảnh - bạn sẽ kết thúc bằng:
(100, 100, 3) -> (100, 100, N)
Ví dụ, với sải chân là 2, bạn dịch chuyển vị trí của bộ lọc theo hai pixel. Do đó, bạn nhận được
(100, 100, 3) -> (50, 50, N)