Bản thân các lớp chập và các lớp gộp là độc lập với kích thước đầu vào. Tuy nhiên, đầu ra của các lớp chập sẽ có kích thước không gian khác nhau cho các hình ảnh có kích thước khác nhau và điều này sẽ gây ra vấn đề nếu chúng ta có một lớp được kết nối đầy đủ sau đó (vì lớp được kết nối đầy đủ của chúng tôi yêu cầu đầu vào có kích thước cố định). Có một số giải pháp cho vấn đề này:
1. Pooling toàn cầu: Tránh các lớp được kết nối đầy đủ ở cuối các lớp chập và thay vào đó sử dụng pooling (như Global Average Pooling) để giảm các bản đồ đặc trưng của bạn từ hình dạng (N, H, W, C) (trước nhóm chung ) để định hình (N, 1,1, C) (sau nhóm toàn cầu), trong đó:
N = Số lượng mẫu xe buýt nhỏ
H = Chiều cao không gian của bản đồ đặc trưng
W = Chiều rộng không gian của bản đồ tính năng
C = Số bản đồ tính năng (kênh)
Như có thể thấy, kích thước đầu ra (N * C) hiện không phụ thuộc vào kích thước không gian (H, W) của các bản đồ đặc trưng. Trong trường hợp phân loại, sau đó bạn có thể tiến hành sử dụng một lớp được kết nối đầy đủ ở trên cùng để có được các bản ghi cho các lớp của bạn.
2. Pooling biến kích thước:Sử dụng các vùng gộp có kích thước thay đổi để có cùng kích thước bản đồ cho các kích cỡ đầu vào khác nhau.
3. Cắt / Thay đổi kích thước / Pad hình ảnh đầu vào: Bạn có thể cố gắng thay đổi / cắt / đệm hình ảnh đầu vào của mình để tất cả có cùng hình dạng.
Trong ngữ cảnh học chuyển, bạn có thể muốn sử dụng các đầu vào có kích thước khác với đầu vào ban đầu mà mô hình đã được đào tạo. Dưới đây là một số tùy chọn để thực hiện:
4. Tạo các lớp được kết nối hoàn toàn mới: Bạn có thể bỏ hoàn toàn các lớp được kết nối đầy đủ ban đầu và khởi tạo một lớp được kết nối đầy đủ mới với kích thước mà bạn cần và huấn luyện nó từ đầu.
5. Xử lý lớp được kết nối đầy đủ dưới dạng tích chập: Thông thường, chúng tôi định hình lại các bản đồ đặc trưng từ (N, H, W, C) đến (N, H * W * C) trước khi đưa nó vào lớp được kết nối đầy đủ. Nhưng bạn cũng có thể coi lớp được kết nối đầy đủ như một tổ hợp với trường tiếp nhận (H, W). Sau đó, bạn chỉ có thể kết hợp hạt nhân này với bản đồ tính năng của mình bất kể kích thước của chúng (sử dụng phần đệm bằng 0 nếu cần) [
http://cs231n.github.io/transfer-learning/ ].