Có thể tìm ra thuật toán nén nào đã được sử dụng cho hình ảnh trong tài liệu PDF không?
Có thể tìm ra thuật toán nén nào đã được sử dụng cho hình ảnh trong tài liệu PDF không?
Câu trả lời:
Bạn có thể sử dụng pdfimages -list $file
trên các hệ thống Unix / Linux, trên Windows, có thể bạn có thể cài đặt poppler để có quyền truy cập vào công cụ (xem https://en.wikipedia.org/wiki/Pdfimages ). Lưu ý rằng đây là một ứng dụng dòng lệnh, không có giao diện người dùng đồ họa. Đầu ra của nó sẽ trông như
page num type width height color comp bpc enc interp object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
1 0 image 1240 1753 gray 1 8 image no 8 0 150 150 301K 14%
2 1 image 1240 1753 gray 1 8 image no 22 0 150 150 281K 13%
3 2 image 1240 1753 gray 1 8 image no 36 0 150 150 336K 16%
Trong đó enc
cột cho bạn biết thuật toán mã hóa, các giá trị có thể được liệt kê trong trang hướng dẫnpdfimages
.
Sắp xếp
Nếu bạn mở tệp PDF trong trình chỉnh sửa văn bản, bạn sẽ tìm thấy một dòng như thế này cho mỗi hình ảnh:
<</Subtype/Image/Length 7986/Filter/FlateDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 368/Height 110/Type/XObject>>stream
...
Hình ảnh này sử dụng bộ lọc FlateDecode, "bộ lọc thường được sử dụng dựa trên thuật toán zlib / deflate (còn gọi là gzip, nhưng không phải zip)"
<</Subtype/Image/Length 892/Filter/DCTDecode/BitsPerComponent 8/ColorSpace 34 0 R/Width 44/Height 23/Type/XObject>>stream
...
Hình ảnh này sử dụng bộ lọc DCTDecode, "bộ lọc tổn thất dựa trên tiêu chuẩn JPEG"
Các định nghĩa bộ lọc được lấy từ trang Wikipedia Định dạng Tài liệu Di động , có danh sách tất cả các bộ lọc được hỗ trợ.
Tuy nhiên, có thể khó tìm ra hình ảnh nào trong trình soạn thảo văn bản - các đối tượng không nhất thiết phải xảy ra theo thứ tự đọc. Chia PDF thành các trang duy nhất có thể giúp đỡ ở đây.
Tôi nghĩ Enf Focus Pitstop Pro , một plugin Acrobat, có thể cung cấp cho bạn thông tin này (cùng với kích thước, vị trí, DPI, v.v.) trong trình kiểm tra đối tượng của nó, nhưng tôi không còn có nó và dường như không thể tìm thấy bất kỳ đề cập nào về cụ thể này thuộc tính trong hướng dẫn của họ.