Tại sao Word 2010 tạo các tệp PDF lớn như vậy?


11

Bây giờ tôi mới nhận thấy rằng các tài liệu Word 2010 (docx) của tôi chỉ dài một trang và bao gồm một đồ họa vector WMF đơn giản và một chút văn bản lớn gần 1 MB. Tài liệu Word chỉ có 50 kB và một tệp PDF được tạo bằng máy in Bullzip PDF có cùng kích thước. Vậy Microsoft viết gì vào 950 kB khác?

Cập nhật: Khi tôi liên tục nhận được câu trả lời gần đây mà tất cả không áp dụng, tôi muốn tiết kiệm cho bạn công việc. Vấn đề đã biến mất sau khi sử dụng Windows 7 thay vì XP (điều mà tôi đã làm hơn một năm trước). Một cái gì đó dường như không được hỗ trợ trên hệ thống cũ, tôi nghi ngờ đó là một số tập hợp phông chữ hoặc như vậy. Ngoài ra tôi không thể thử đề xuất của bạn vì vấn đề không còn tồn tại nữa. Vì vậy, tôi không thể chấp nhận câu trả lời cho điều này.


Đầu ra có khớp không? Tôi sẽ đoán Word sẽ phù hợp với định dạng PDF gần hơn với Bullzip (thường không bao giờ nghe về nó).
Ramhound

1
Điều này chỉ bắt đầu xảy ra sau khi cập nhật WORD2010 mới nhất. Tôi có WORD2010 và Acro Reader 9.5, nhưng một máy tính không nhận được các bản cập nhật WORD gần đây. Máy tính đó lấy một tệp DOCX được tải rất nhiều bằng hình ảnh và chuyển đổi nó XUỐNG từ 4 MB thành 3 MB, máy tính khác có các bản cập nhật WORD gần đây chuyển đổi DOCX từ 4 MB thành 18 MB. Tôi không thể sử dụng một tập tin lớn như vậy. KHÔNG CẬP NHẬT chương trình WORD CỦA BẠN.

1
Có vẻ như Word đang xuất hình ảnh ở định dạng bitmap độ phân giải rất cao. Phóng to và so sánh các tệp PDF được tạo bởi Word và Bullzip và so sánh chất lượng
tumchaaditya

1
Trời ơi, cái này cũ rồi. Word 2010 bắt đầu tạo các tệp PDF có kích thước hợp lý hơn sau khi chuyển từ Windows XP sang Windows 7. Tôi giả sử rằng Windows 7 có một số API tập hợp phông chữ mà Word sử dụng mà Windows XP không có, do đó, nó luôn bao gồm phông chữ hoàn chỉnh hoặc một cái gì đó .
ygoe

1
Tôi cũng gặp vấn đề tương tự khi sử dụng Word 2013 trên Windows 7 Pro 64 bit: Tôi có tệp 14kB Word 2013 (docx) của văn bản CHỈ LORem ipsum với định dạng mặc định, Word tạo tệp PDF 90kB khi PDFcreator tạo tệp PDF 22kB. Và nó phát triển nhanh chóng, cùng một tệp với một số định dạng (Tiêu đề, tiêu đề 1 và 2), tệp Word 15kB (không có hình ảnh) trở thành tệp 230kB với lưu PDF của Word dưới dạng (sử dụng nén tối đa), mặc dù chỉ 30kB với PDFcreator. Vấn đề của tôi là PDFcreator không xử lý các liên kết.
Thomas

Câu trả lời:


2

Đây vẫn là một vấn đề với Word 2016. Có lẽ không giống như OP đã có, nhưng nó vẫn ở đó: bắt đầu với tài liệu 1 trang 20 KB, lưu dưới dạng PDF, nhận tệp PDF 300 KB.

Tôi không thể nói tại sao Word làm điều này, nhưng có một cách dễ dàng để thu nhỏ các tệp PDF này: cài đặt GhostScript , sau đó chạy lệnh sau:

gswin64c.exe -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH "-sOutputFile=%2" "%1"

Trong đó% 1 là PDF đầu vào và% 2 là PDF đầu ra. Biến PDF 300 KB đó thành PDF 40 KB. Vẫn không nhỏ như CutePDF (cái này quản lý khoảng 30 KB cho cùng một tài liệu) nhưng là một cải tiến lớn.

Hoặc chỉ cần bỏ qua bước này và in trực tiếp lên CutePDF.


1
Xem bình luận của Arjan về câu trả lời của Jakke.
fixer1234

Sao lưu câu trả lời. Thay vì 670k, cutePDF đã tạo một tệp 170k.
szako

1

Nhiều lý do.

  1. Kiểu dáng XML
  2. Hình ảnh được chuyển đổi thành base64, 33%lớn hơn ảnh gốc
  3. Những thứ khác như phông chữ, v.v ...
  4. Rất nhiều thứ dường như không làm gì cả!

1

Kiểm tra cài đặt tùy chọn của bạn trong Word 2010. Bạn có thể hướng dẫn Word nhúng một hoặc một số toàn bộ phông chữ vào tài liệu của bạn. Điều này gây ra sự phình to tài liệu khủng khiếp đặc biệt là nếu bạn đang sử dụng phông chữ Unicode. Bỏ chọn tùy chọn đó nếu nó được chọn và Word sẽ chỉ nhúng các ký tự thực sự được sử dụng trong tài liệu của bạn.

Bạn cũng nên lưu ý rằng * .docx là định dạng tệp nén phải được giải nén trước khi có thể chuyển đổi thành tệp PDF có thêm kích thước của nó.

Nếu điều này không phù hợp với bạn, có một số công cụ tối ưu hóa PDF có sẵn thông qua Adobe và Nuance.

Hi vọng điêu nay co ich.


0

Suy nghĩ: Word đang chuyển đổi đồ họa vector thành bitmap hoặc PNG và nhúng nó vào tài liệu với giới hạn hoặc không nén. Kiểm tra cài đặt PDF và xem nếu bạn có thể điều chỉnh đó.

Phân tích: Một cách để kiểm tra đó là thay đổi phần mở rộng tệp của tệp Word thành .ZIP và tự mình xem Word đang làm gì!


2
Bạn hoàn toàn không thể chỉnh sửa thế hệ PDF của Word. Bạn chỉ có thể chọn từ chất lượng "bình thường" và "web", nhưng điều đó chỉ tạo ra một vài kB khác biệt. Tôi sẽ phải kiểm tra chuyển đổi từ vectơ sang pixel, có thể nhìn thấy ở các yếu tố thu phóng rất cao.
ygoe

3
Thật kỳ lạ, khi tôi phóng to tài liệu PDF, tôi thấy văn bản và đồ họa raster trong một thời gian rất ngắn. Nó trông giống như một ảnh chụp màn hình cửa sổ Word, bao gồm văn bản được làm mịn ClearType ở độ phân giải thấp. Sau khoảnh khắc đó, nội dung được thay thế bằng các bản vẽ vector độ phân giải cao, cho đồ họa và văn bản. Làm cách nào tôi có thể xem tài liệu PDF để tìm hiểu xem có một hình ảnh pixel ẩn bên trong có thể bị xóa không?
ygoe

Tôi cũng không tin đây là lý do. Tôi đã nhận thấy sự phình to tương tự với các tài liệu không chứa hình ảnh.
HappyNomad

@LonelyPixel: Có thể mất một chút thời gian để trình đọc PDF của bạn hiển thị lại nội dung khi phóng to ..
tumchaaditya

0

Điều này là do định dạng của tài liệu PDF sẽ chứa các kiểu cho (có thể) mỗi ký tự. Tôi đã làm một cái gì đó như thế này nhưng vào HTML và nó đã tạo ra một tệp html 20KB dưới dạng tệp 600KB.


0

Sử dụng phần mềm được thiết kế cho một mục đích cụ thể. Word rất tốt trong việc tạo tài liệu từ và vì rất nhiều phần mềm phù hợp khác thêm tính năng, MS không thể loại bỏ nó. Tôi thực sự không thấy lý do tại sao họ chọn dành nhiều thời gian và nỗ lực để tối ưu hóa một cái gì đó mà hầu hết mọi người thậm chí không sử dụng hoặc quan tâm nhiều. Những người quan tâm, không sử dụng từ để in PDF.

Bạn nên xem xét việc cài đặt một máy in PDF chuyên dụng trên máy tính của bạn và sử dụng chức năng PRINT để tạo tệp PDF. Có rất nhiều gói thương mại và miễn phí có sẵn thực hiện công việc hoàn hảo và giữ cho tệp PDF của bạn được nén ở mức tối thiểu.

Hỏi TẠI SAO chính xác Word tạo ra các tệp PDF khổng lồ như vậy là điều bạn nên hỏi các kỹ sư MS trên diễn đàn của họ ... chỉ họ mới có thể nói. Ở đây bạn sẽ nhận được rất nhiều dự đoán về lý do tại sao MS làm mọi thứ theo cách họ làm.


1
Tôi rất thích chức năng xuất PDF tích hợp, vì nó bảo tồn các bảng nội dung có thể nhấp hoặc các URL được nhúng và những thứ tương tự. (Như vậy, việc xuất trong OpenOffice rất tuyệt.) Một số phần mềm có thể hoạt động tốt với các tùy chọn in PDF nếu được HĐH cung cấp . Giống như một số trình duyệt trong OS X hoạt động hoàn hảo với tính năng in PDF tích hợp .
Arjan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.