Duyệt cấu trúc PDF nội bộ


18

Làm cách nào để duyệt cấu trúc PDF nội bộ trong adobe 9.0?

Tôi không tìm thấy menu nâng cao có tùy chọn này.

Ai có thể giúp tôi?

pdf 

Câu trả lời:


23

Có một số cách để duyệt cấu trúc bên trong của PDF.

Pdf là loại người có thể đọc được

Chặn mật khẩu bảo mật, phần lớn là con người có thể đọc được. Nếu một tệp PDF có mật khẩu, tất cả các chuỗi và luồng (sẽ được nén, không bị mất) sẽ là rác giả ngẫu nhiên. Luồng dữ liệu nén rất nhiều, nhưng phần lớn trông giống như thế này trong trình soạn thảo văn bản yêu thích của bạn:

2 0 obj
<< /Type /Page 
   /MediaBox [0 0 612 792]
   /Contents 4 0 R
   /Resources << /Fonts 
     << /F1 5 0 R>> 
   >>
>>
endobj

Cảnh báo: Khoảng trắng phần lớn không liên quan và thường bị xóa khi có thể. Tôi chỉ làm điều này đẹp để làm cho nó dễ dàng hơn một chút.

<<>> bắt đầu và kết thúc "từ điển". Từ điển được tạo thành từ các cặp khóa / giá trị. Khóa luôn là "tên": tất cả các tên bắt đầu bằng '/'. Giá trị có thể là bất cứ điều gì, bao gồm cả tên khác.

[] bắt đầu và kết thúc "mảng". Mảng có thể được tạo thành từ bất cứ thứ gì.

Số là "số". Điểm nổi hoặc cách khác.

()<> bắt đầu và kết thúc "chuỗi". <> chuỗi được liệt kê dưới dạng giá trị hex, () là chuỗi ANSI.

Pet Peeve: / Tên và (Chuỗi) sử dụng các hệ thống thoát hoàn toàn khác nhau. Grr.

Tham chiếu gián tiếp trỏ đến các đối tượng khác trong PDF:
<objNum> <thế hệ-Luôn luônZero> R

Trong đối tượng ví dụ trên, luồng nội dung nằm trong đối tượng 4, ở nơi khác trong PDF. Để tìm thấy nó, bạn có thể sử dụng tìm kiếm văn bản của biên tập viên cho "N 0 obj" trong đó N là số đối tượng bạn muốn.
CẢNH BÁO: Có hàng trăm, có thể hàng ngàn đối tượng trong một tệp PDF. Tìm kiếm "1 0 obj" sẽ giúp bạn có rất nhiều lượt truy cập.

Cho rằng bạn đang yêu cầu xem cấu trúc bên trong, có lẽ bạn đã biết tất cả điều này. Những người khác muốn biết điều tương tự có thể không.

CẢNH BÁO: Không EDIT PDF trong trình soạn thảo văn bản. Tất cả những thứ nhị phân đó sẽ bị xáo trộn, bù đắp byte rất quan trọng trong PDF.

Plugin Acrobat [s]

Có một plugin acrobat gọi là PDF CanOpener của Windjack Solutions (không liên kết). Đó là SLICK. Bạn sẽ có thể duyệt cấu trúc PDF dưới dạng cây, xem (và sửa đổi) các luồng nội dung, v.v.

Ứng dụng của bên thứ ba

Rất nhiều. Nhiều người xây dựng một phần như là một phần của việc học phân tích PDF hoặc như một công cụ sửa lỗi. Chúng khá tiện dụng.

iText RUPS (một phần của iText, một lib Java PDF, hiện có trên GitHub)

Trình duyệt đối tượng PDF

Vole PDF


1
PDF Voleliên kết dường như bị phá vỡ ngay bây giờ ...
DNA

5
+1 cho iText RUPS, không chính xác là GUI thân thiện nhưng hoạt động, bằng cách hiện tại URL dự án dường như là ( sourceforge.net/projects/itextrups )
Jaime Hablutzel

2
iText RUPS đã được chuyển đến đây: github.com/itext/rups
bmaupin

1
Có một bản sao của mã nguồn pdfvole tại đây: github.com/Rossi1337/pdf_vole
yms

1
Nếu PDF có luồng dữ liệu nén, tiện ích dòng lệnh qpdf có thể giải mã / giải mã chúng và viết ra một tệp PDF có nội dung dễ hiểu hơn: `qpdf --decode-level = all --stream-data = giải nén inputfile.pdf extendfile. pdf
skierpage




2

Trình chỉnh sửa PDF-XChange miễn phí có bảng Nội dung cho phép bạn xem cấu trúc cây của tệp PDF.

View -> Panes -> Content

2

PDF Vole dường như bị phá vỡ. Nếu bất cứ ai vẫn đang tìm kiếm một công cụ, tôi đang sử dụng Trình phân tích PDF miễn phí .

nhập mô tả hình ảnh ở đây

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.