Đây là một đoạn ngắn trong câu trả lời đầu tiên từ Djib2011. Câu trả lời ngắn gọn là không. Dài hơn - Đầu tiên, các bức ảnh luôn được mã hóa dưới dạng tenxơ như sau. Một hình ảnh là một số pixel. Nếu ảnh được coi là có m hàng và n cột, thì mỗi pixel được chỉ định bởi vị trí của hàng và cột, đó là theo cặp (m, n). Đặc biệt, có những pixel m * n rất lớn ngay cả đối với ảnh 'nhỏ'. Mỗi pixel của ảnh được mã hóa bằng một số từ 0 đến 1 (cường độ đen) nếu ảnh có màu đen và trắng. Nó được mã hóa bằng ba số (cường độ RGB) nếu ảnh có màu. Vì vậy, một cuộn dây với một tenxơ là 1xmxn hoặc 3xmxn. Nhận dạng hình ảnh được thực hiện thông qua CNN, lợi dụng thực tế là ảnh không thay đổi nhiều từ pixel sang pixel, néndữ liệu thông qua các bộ lọc và gộp chung. Vì vậy, vấn đề là CNN hoạt động bằng cách nén số lượng điểm dữ liệu (hoặc tính năng) cực lớn của ảnh thành một số lượng giá trị nhỏ hơn. Vì vậy, dù bạn bắt đầu với định dạng nào, CNN sẽ bắt đầu bằng cách nén thêm dữ liệu của ảnh. Do đó, sự độc lập tự nhiên từ kích thước của hình ảnh.
Tuy nhiên, một CNN sẽ yêu cầu tất cả các hình ảnh được chạy qua nó đều có cùng kích thước. Vì vậy, có sự phụ thuộc sẽ thay đổi tùy thuộc vào cách lưu hình ảnh. Ngoài ra, trong phạm vi các định dạng tệp khác nhau có cùng kích thước tạo ra các giá trị khác nhau cho các thang đo của chúng, người ta không thể sử dụng cùng một mô hình CNN để xác định ảnh được lưu trữ bằng các phương pháp khác nhau.