Tôi nghĩ cách tốt nhất của bạn sẽ là chuyển đổi PDF thành hình ảnh ở độ phân giải tốt và hơn là so sánh hình ảnh.
Để tạo hình ảnh từ PDF, bạn có thể sử dụng Thư viện Adobe PDF hoặc giải pháp được đề xuất tại Cách tốt nhất để chuyển đổi tệp pdf sang tệp tiff .
Để so sánh các tệp TIFF đã tạo, tôi tìm thấy GNU tiffcmp (đối với phần cửa sổ của GnuWin32 tiff ) và tiffinfo đã làm rất tốt. Sử dụng tiffcmp -l và đếm số dòng đầu ra để tìm bất kỳ sự khác biệt nào. Nếu bạn hài lòng khi có một lượng nhỏ thay đổi nội dung (ví dụ: sự khác biệt về khử răng cưa) thì hãy sử dụng tiffinfo để đếm tổng số pixel và sau đó bạn có thể tạo giá trị chênh lệch phần trăm.
Nhân tiện, đối với bất kỳ ai thực hiện so sánh PDF đơn giản mà cấu trúc không thay đổi, có thể sử dụng dòng lệnh diff và bỏ qua các mẫu nhất định, ví dụ với GNU diff 2.7:
diff --brief -I xap: -I xapMM: -I / CreationDate -I / BaseFont -I / ID --binary --text
Điều này vẫn có một vấn đề là nó không phải lúc nào cũng bắt được các thay đổi trong tên phông chữ được tạo.