Điều gì khiến kích thước tệp PDF tăng khi lưu trong Bản xem trước?


17

Có vẻ như thực hiện các chỉnh sửa, chú thích hoặc thậm chí chỉ cần mở và lưu tệp PDF trong Bản xem trước sẽ gây ra sự gia tăng đáng kể về kích thước tệp. Tôi nhận thấy rằng đối với một số sách tôi đã quét, điều này cũng xảy ra để cải thiện thời gian kết xuất trang.

Bất cứ ai cũng có thể làm sáng tỏ những gì đang xảy ra để gây ra những thay đổi này? Tôi quan tâm đến việc đồng bộ các chú thích của sách điện tử PDF giữa Bản xem trước và iPad (có thể là GoodReader) nhưng điều này có thể quá không thực tế với các tệp PDF lớn.


2
Điều này có thể là do cách họ quyết định mã hóa các tệp PDF trong bản xem trước. Các tệp PDF hiện là một định dạng mở nhưng điều đó không nhất thiết có nghĩa là mọi người đều mã hóa chúng theo cùng một cách. Đặt cược an toàn nhất của bạn là có được một trình soạn thảo Adobe PDF và sử dụng nó. Theo những người này, các cuộc thảo luận.apple.com / thead / 3896311? Start = 0 & tart = 0 , điều đó tạo nên sự khác biệt. Họ cũng thảo luận về lý do có thể đằng sau vấn đề của bạn.
Tony

Câu trả lời:


12

Trong cuốn tiểu thuyết ít được biết đến của mình, PDF Karenina , Leo Tolstoy đã viết,

Các tệp PDF được mã hóa tối ưu đều giống nhau; mỗi tệp PDF được mã hóa tối ưu phụ được mã hóa tối ưu phụ theo cách riêng của nó.

Khó ai có thể trả lời tại sao các tệp PDF của bạn lớn hơn sau khi Xem trước sửa đổi chúng. Tệp PDF bao gồm nhiều loại dữ liệu khác nhau: hình ảnh, luồng nội dung, phông chữ, chi phí tài liệu, không gian màu, trạng thái đồ họa mở rộng và bảng tham chiếu chéo. Giống như một câu có thể ngắn gọn và dài dòng khác, nhưng cả hai đều là tiếng Anh hợp lệ và nói cùng một điều, do đó, một tệp PDF có thể có cách biểu thị nội dung giống như một tệp PDF ngắn gọn hơn. Chúng tôi phải xem xét các tệp PDF chính xác của bạn. Có khả năng là chúng được tạo ra bởi nhiều phần mềm khác nhau, một số điều khoản, một số ít như vậy.

Nó cũng quan trọng bạn đang sử dụng phiên bản Mac OS X và Preview nào, bởi vì điều đó xác định phần mềm ghi tệp PDF mới khi bạn thực hiện Lưu dưới dạng xem trước.

Tuy nhiên, tôi có thể cho bạn biết những gì lớn hơn về một số tệp PDF của tôi . Câu chuyện này áp dụng cho máy tính của tôi, chạy Mac OS X 10.5.8 và Apple Preview 4.2 (469.5).

Một tệp, Giulio.pdflà một tài liệu 22 trang với văn bản dưới dạng văn bản, không được quét hình ảnh. Nó có kích thước lớn 461.092 byte. Tôi đã mở nó trong Bản xem trước, thực hiện Tệp ... Lưu dưới dạng ... và lưu dưới tên tệp mới. Tệp mới là 724,421 byte, hoặc lớn hơn 57%.

Tôi đã mở từng tệp bằng Adobe Acrobat Professional, phiên bản 8.3.1 cho Mac OS. Tôi đã nâng cao ... PDF Optimizer ... Space Audit Cách sử dụng ... . Một hộp thoại nhỏ đã phân tích xem có bao nhiêu byte do mỗi loại sử dụng, cộng với phần trăm của tổng kích thước tệp cho danh mục.

Bản gốc Giulio.pdfcó 390.754 byte (84,75%) dành cho các luồng nội dung và 0 byte dành cho hình ảnh. Nó ở định dạng PDF 1.4. Tệp được lưu bởi Preview có 675.846 byte (93,29%) dành cho các luồng nội dung, cũng là byte hình ảnh bằng 0 và ở định dạng PDF 1.3. Việc xem trước làm cho các luồng nội dung lớn hơn 285.092 byte và chiếm 73% chênh lệch kích thước tệp giữa hai luồng.

Tôi tự hỏi nếu định dạng tệp PDF 1.3 vốn đã kém hiệu quả hơn để lưu trữ loại tệp này. Tôi đã mở bản gốc Giulio.pdftrong Adobe Acrobat Professional 8 và đã nâng cao ... Trình tối ưu hóa PDF ... Tương thích với: Acrobat 3.0 trở lên và nhấn OK. Tôi đã lưu tập tin kết quả dưới một tên mới. Tệp kết quả có định dạng PDF 1.3 và là 452.356 byte hoặc nhỏ hơn bản gốc. Các luồng nội dung của nó là 375.171 byte (82,94%), tỷ lệ tương tự, nhưng nhỏ hơn các luồng nội dung của tệp gốc.

Do đó, dường như chúng ta có thể kết luận rằng ứng dụng Xem trước trên Mac OS X 10.5.8 không hiệu quả như một số người tạo PDF khác trong việc tạo luồng nội dung ngắn gọn trong các tệp PDF và sự khác biệt là đủ để chiếm 3/4 sự khác biệt về kích thước trong một tệp PDF không có hình ảnh.

Tôi đã làm một thí nghiệm tương tự trên form k.pdf, một tài liệu 1 trang được quét từ giấy. Tệp gốc là 303.730 byte, trong đó có 298.197 byte (98,18%) là hình ảnh. Một bản sao của tệp này được tạo bởi Preview bằng Save As ... là 300.601 byte, hoặc nhỏ hơn 1%. Sự khác biệt về kích thước tệp này được tính nhiều hơn bởi một loại byte "phí tài liệu" nhỏ hơn trong tệp được tạo bởi Preview.

Do đó, dường như chúng ta cũng có thể kết luận rằng Bản xem trước không phải lúc nào cũng khiến tệp PDF tăng kích thước. Nó phụ thuộc vào bản chất của tệp PDF gốc và mức độ ngắn gọn của nó.


3

Tôi biết điều này khá muộn, nhưng tôi đã tìm thấy thứ gì đó có vẻ hoạt động, ít nhất là nếu được sử dụng ban đầu: Tôi đã thử sử dụng bộ lọc Quartz để "Giảm kích thước tệp". Nó có vẻ hoạt động nhưng không phải mặc định. Tôi đặc biệt có thể chọn nó thông qua menu Save As (giữ Tùy chọn), nhưng tôi lo lắng rằng nó mặc định theo phương thức thông thường trên ô tô.

Đây là những gì đang xảy ra với tôi và làm thế nào tôi đến trang này ở nơi đầu tiên: PDF bắt đầu như một cuốn sách 91 trang 900 MB. Tôi thêm một chú thích và lưu nó và tập tin nhảy lên tới 2,29GB. Để tắt nó, phải mất mãi mãi để lưu, đặc biệt là khi tôi lưu vào ổ đĩa ngoài. Cảm ơn ổ đĩa là USB 3!

Có cách nào để trích xuất các chú thích này? Tôi có thể chú thích và tô sáng trên Goodreader và PDF Expert trên iPad của mình. Nếu Xem trước không thể cho phép tôi làm điều này trên máy tính của mình, thì có ứng dụng nào khác không? Tại sao nó không thể chỉ lưu các chú thích / điểm nổi bật mà không cố gắng giải nén tất cả các hình ảnh như tôi đang lưu lại JPEG mỗi lần. Cảm ơn đã giúp đỡ!


Công việc này: 400 KiB> 1.3 MiB> 540 KiB. Bản PDF gốc của tôi dưới 400 KiB và trở thành 1.3 MiB quái dị sau khi thêm một vài điểm nổi bật / gạch chân. Tôi đã làm theo đề xuất và tệp đã giảm xuống còn 540 KiB: Lưu dưới dạng ... với Bộ lọc Quartz được đặt thành Giảm kích thước tệp . Tôi vẫn có thể chỉnh sửa các điểm nổi bật trước đó (điều này trở nên bất khả thi với Xuất dưới dạng PDF ... ) và kích thước phù hợp hơn với những gì tôi nhận được bằng cách chỉnh sửa nó trên một thiết bị khác.
Daniel

1

Vấn đề vẫn còn là một vấn đề nghiêm trọng. Trong Bản xem trước 7.0 (Mac Os 10.9.5.) Tôi đã tạo pdf bằng Acrobat 9.5.5. dẫn đến một tệp 5 MB. Trong phần Xem trước tôi đã thêm chính xác 12 ký tự (sử dụng các công cụ chỉnh sửa). Sau khi lưu tập tin này, nó bị mất đến 14 MB.

Bạn có thể khắc phục bằng cách mở và lưu lại trong Acrobat (có thể phải sử dụng tùy chọn "giảm kích thước tệp").


2
Điều này không giải thích tại sao nó xảy ra, đó là những gì câu hỏi đang hỏi.
Ian C.

0

Không thể thêm manh mối vào giải pháp. Tôi có thể thêm một kịch bản tương tự (OS X 10.11.3): pdf được quét có trọng lượng ~ 800kb được mở trong bản xem trước, một vài trang được quét trống sẽ bị xóa, kết quả là pdf ngắn hơn hai trang là ~ 2,2Mb. "Tùy chọn - Lưu dưới dạng" và chọn bộ lọc thạch anh "giảm kích thước tệp" nén tệp xuống ... 1,9Mb.

Tệp gốc đã được tạo bởi máy photocopy Xerox WC 7830, theo kinh nghiệm của tôi (so với máy in / máy photocopy đa chức năng trước đây chúng tôi có) tạo ra các bản pdf được quét được tối ưu hóa khá tốt.

Không thể thấy bất kỳ sự khác biệt trong tập tin, trực quan; Tôi đoán hình ảnh trang đang được nén lại trong 24bpp, trong khi tệp gốc rõ ràng sử dụng độ sâu màu ít hơn nhiều, có khả năng là 6 bit (đó là tài liệu được in và ký, chỉ văn bản, trình quét giúp giữ tốt công việc giữ nền trắng tinh khiết). Đáng buồn thay, Preview không đủ thông minh để phát hiện và duy trì điều này, và dường như cần phải giải nén lại toàn bộ tập tin mặc dù không có thay đổi nào được thực hiện trong các trang còn lại (một lần nữa, chỉ một vài trang đã bị xóa.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.