Các thuật toán băm hoặc tính toán CRC thông thường không hoạt động tốt với dữ liệu hình ảnh. Bản chất chiều của thông tin phải được tính đến.
Nếu bạn cần tính năng lấy dấu vân tay cực kỳ mạnh mẽ, để tính đến các phép biến đổi affine (chia tỷ lệ, xoay, dịch, lật), bạn có thể sử dụng phép biến đổi Radon trên nguồn hình ảnh để tạo ánh xạ quy chuẩn cho dữ liệu hình ảnh - lưu trữ dữ liệu này với mỗi hình ảnh và sau đó chỉ so sánh các dấu vân tay. Đây là một thuật toán phức tạp và không dành cho những người yếu tim.
Một số giải pháp đơn giản có thể thực hiện được:
- Tạo biểu đồ độ sáng cho hình ảnh dưới dạng dấu vân tay
- Tạo các phiên bản thu nhỏ của từng hình ảnh dưới dạng dấu vân tay
- Kết hợp kỹ thuật (1) và (2) thành một phương pháp kết hợp để cải thiện chất lượng so sánh
Biểu đồ độ sáng (đặc biệt là biểu đồ được tách thành các thành phần RGB) là một dấu vân tay hợp lý cho một hình ảnh - và có thể được triển khai khá hiệu quả. Trừ một biểu đồ này khỏi một biểu đồ khác sẽ tạo ra một biểu đồ mới mà bạn có thể xử lý để quyết định mức độ tương tự của hai hình ảnh. Biểu đồ, bởi vì chỉ đánh giá sự phân bố và xuất hiện của thông tin độ sáng / màu sắc xử lý các phép biến đổi affine khá tốt. Nếu bạn định lượng thông tin độ sáng của từng thành phần màu xuống giá trị 8-bit, thì 768 byte dung lượng lưu trữ là đủ cho dấu vân tay của một hình ảnh có kích thước gần như hợp lý. Biểu đồ độ sáng tạo ra âm tính giả khi thông tin màu trong hình ảnh được thao tác. Nếu bạn áp dụng các biến đổi như độ tương phản / độ sáng, posterize, chuyển màu, thay đổi thông tin độ sáng.
Sử dụng hình ảnh được chia tỷ lệ là một cách khác để giảm mật độ thông tin của hình ảnh đến mức dễ so sánh hơn. Giảm xuống dưới 10% kích thước hình ảnh gốc thường làm mất quá nhiều thông tin được sử dụng - vì vậy, hình ảnh 800x800 pixel có thể được thu nhỏ xuống 80x80 và vẫn cung cấp đủ thông tin để thực hiện lấy dấu vân tay tốt. Không giống như dữ liệu biểu đồ, bạn phải thực hiện chia tỷ lệ dị hướng của dữ liệu hình ảnh khi độ phân giải nguồn có tỷ lệ khung hình khác nhau. Nói cách khác, việc giảm hình ảnh 300x800 thành hình thu nhỏ 80x80 gây ra biến dạng hình ảnh, như vậy khi so sánh với hình ảnh 300x500 (rất giống) sẽ gây ra âm bản giả. Dấu vân tay hình thu nhỏ cũng thường tạo ra âm tính giả khi có các phép biến đổi affine. Nếu bạn lật hoặc xoay một hình ảnh,
Kết hợp cả hai kỹ thuật là một cách hợp lý để bảo vệ cược của bạn và giảm khả năng xảy ra của cả dương tính giả và âm tính giả.