Về cơ bản, đào tạo tích chập hoàn toàn lấy toàn bộ hình ảnh MxM và tạo đầu ra cho tất cả các tiểu phần trong một chuyển tiếp ConvNet duy nhất . Đào tạo chắp vá cắt xén rõ ràng các tiểu phần và tạo đầu ra cho mỗi tiểu phần trong các lần chuyển tiếp độc lập . Do đó, đào tạo tích chập hoàn toàn thường nhanh hơn đáng kể so với đào tạo chắp vá.
Vì vậy, để đào tạo tích chập hoàn toàn, bạn thực hiện cập nhật như thế này:
- Nhập toàn bộ hình ảnh MxM (hoặc nhiều hình ảnh)
- Đẩy qua ConvNet -> lấy toàn bộ bản đồ đầu ra (kích thước tối đa MxM trên mỗi hình ảnh, có thể nhỏ hơn)
- Thực hiện cập nhật bằng cách mất tất cả các đầu ra
Bây giờ trong khi điều này khá nhanh, nó hạn chế quá trình lấy mẫu đào tạo của bạn so với đào tạo theo chiều dọc: Bạn buộc phải thực hiện nhiều cập nhật trên cùng một hình ảnh(thực ra, tất cả các cập nhật có thể có cho tất cả các tiểu phần) trong một bước đào tạo của bạn. Đó là lý do tại sao họ viết rằng đào tạo tích chập hoàn toàn chỉ giống với đào tạo chắp vá, nếu mỗi lĩnh vực tiếp nhận (hay còn gọi là phụ) của một hình ảnh được chứa trong một đợt đào tạo của quy trình đào tạo chắp vá (đối với đào tạo theo chiều dọc, bạn cũng có thể có hai trong số mười khả năng các hình ảnh con từ hình ảnh A, ba trong số tám hình ảnh con có thể có từ hình ảnh B, vv trong một lô). Sau đó, họ lập luận rằng bằng cách không sử dụng tất cả các kết quả đầu ra trong quá trình huấn luyện tích chập hoàn toàn, bạn sẽ tiến gần hơn đến việc đào tạo lại một lần nữa (vì bạn không thực hiện tất cả các cập nhật có thể cho tất cả các hình ảnh con trong một bước đào tạo). Tuy nhiên, bạn lãng phí một số tính toán. Ngoài ra, trong Mục 4.4 / Hình 5,