Khám phá siêu dữ liệu về PDF


32

Giả sử tôi có một tệp PDF và tôi muốn lấy bất kỳ siêu dữ liệu nào có sẵn cho tệp PDF đó. Tôi nên sử dụng tiện ích gì?

Tôi tìm thấy thông tin mà tôi thường quan tâm nhất là kích thước giấy, thứ mà người xem PDF thường không báo cáo. Ví dụ, thư kích thước PDF, hợp pháp, A4 hoặc cái gì khác? Nhưng các thông tin khác có sẵn cũng có thể được quan tâm.

EDIT: Đây là một hướng dẫn hữu ích về kích thước giấy, nhờ @terdon.


Kỳ dị. Tại sao ai đó đánh giá thấp câu hỏi này? Quan tâm để giải thích?
Faheem Mitha

Câu trả lời:


39

Một trong những công cụ kinh điển cho việc này là pdfinfo, đi kèm với xpdf, nếu tôi nhớ lại. Ví dụ đầu ra:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

1
Trong Debian ít nhất đây là một phần của poppler-utils. Tôi có một tập tin ở đây mà pdfinfo báo cáo là 595,2 x 841,44 điểm. Nhưng điều này không được báo cáo là A4. Điều gì quyết định đánh dấu nó là A4?
Faheem Mitha

2
Tên được mã hóa cứng : chữ cái là 612 ± 0,1 x 792 ± 0,1, kích thước ma thuật cho DIN / ISO A là (tất cả ± 1 pt): 3370,98, 2383,64, 1685,49, 1191.82, 842.74, 595.91, ..., vì vậy có vẻ như trang của bạn hơi nhỏ một chút quá hẹp pdfinfođể chọn nó.
Ulrich Schwarz

Tôi thấy, bit của mã if ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))?
Faheem Mitha

Đó là chữ cái, các định dạng A nằm trong vòng lặp với sqrt(2)s.
Ulrich Schwarz

13

Một tiện ích khác đáng để xem xét là exiftool . Nó có thể không phải là công cụ phù hợp trong trường hợp cụ thể của bạn vì nó không báo cáo bất kỳ thông tin nào về hình dạng của tài liệu nhưng nói chung nó có thể là công cụ đầy đủ tính năng nhất để kiểm tra siêu dữ liệu PDF.

Dưới đây là ví dụ về lệnh sẽ in tất cả thông tin meta có sẵn ( -a), được sắp xếp theo nhóm ( -G1):

exiftool -a -G1 "$File"

Tài liệu chính thức cung cấp tổng quan về các thẻ liên quan đến PDF được hỗ trợ:

Bạn có thể cài đặt exiftool trên Debian / Ubuntu với:

sudo apt-get install libimage-exiftool-perl

Nếu bạn quan tâm nhiều hơn đến khía cạnh GUI, bạn có thể thử dự án PDFMtEd của tôi . Đó là một bộ công cụ đóng vai trò là mặt trận đồ họa để exiftool và cho phép xem và chỉnh sửa siêu dữ liệu PDF.

Dưới đây là một vài ảnh chụp màn hình:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.