Nên sử dụng cài đặt nào khi tạo tệp 7zip để được nén tối đa khi nén tệp PDF?


15

Nên sử dụng cài đặt nào khi tạo tệp 7zip để được nén tối đa? Tôi đang nén tài liệu PDF có chứa hình ảnh được quét. Tôi đang suy nghĩ về việc sử dụng LZMA2, nhưng tôi không biết nên đặt gì trong kích thước từ điển, kích thước từ, v.v. Ngoài ra, LZMA hoặc PPMd sẽ là lựa chọn tốt hơn?

Tôi cần chuyển một số tệp (~ 200MiB) qua mạng và tốc độ tải lên ở đây rất chậm, vì vậy tôi muốn nén dữ liệu càng nhiều càng tốt. Thời gian sử dụng CPU không quan trọng lắm.

BIÊN TẬP

Đây là những gì tôi nhận được sau khi thử nghiệm các phương pháp nén khác nhau:

Kích thước không nén là: 25.462.686B

Bộ xử lý của tôi là Intel Core 2 Because T8100 và tôi có ram 4GiB.

Nén tốt nhất là với PeaZip bằng thuật toán PAQ8O. Kết quả kích thước tập tin là 19.994.325B. Cài đặt được sử dụng là mức nén: tối đa. Thật không may, tốc độ nén là khoảng 5KiB / giây, vì vậy phải mất hơn một giờ để nén dữ liệu.

Tiếp theo là máy nén PAQ9O thử nghiệm. Sử dụng nó, tôi nhận được 20.132.660B trong khoảng 3 phút nén. Thật không may, chương trình chỉ là dòng lệnh và không có nhiều chương trình khác sử dụng thuật toán nén đó. Nó cũng sử dụng khoảng 1,5GiB RAM với các cài đặt tôi đã sử dụng (a -9 -c)

Sau đó là 7-Zip 9.15 beta (2010-06-20) bằng LZMA2. Sử dụng nó, tôi nhận được 20.518.802B trong khoảng 3 phút. Cài đặt được sử dụng là kích thước từ 273, kích thước từ điển 64MB và tôi đã sử dụng 2 luồng để nén.

Bây giờ trở lại câu hỏi ban đầu của tôi: Trong trường hợp của tôi, kích thước khối rắn không tạo ra bất kỳ kết quả đáng chú ý nào. Tăng kích thước từ đã tạo ra một số kết quả. Sự khác biệt giữa kích thước từ cao nhất và nhỏ nhất là 115.260B. Tôi tin rằng những khoản tiết kiệm như vậy sẽ chứng minh những nỗ lực cần thiết để thực hiện hai lần nhấp cần thiết và thay đổi kích thước từ.

Tôi đã thử sử dụng các thuật toán nén khác được hỗ trợ bởi 7zip và PeaZip và chúng tạo ra các tệp có kích thước từ 19,8MiB đến 21,5MiB.

Cuối cùng, kết luận của tôi là khi nén các tài liệu PDF có chứa hầu hết các hình ảnh, nỗ lực cần thiết để sử dụng các thuật toán nén kỳ lạ là không hợp lý. Nén bằng LZMA2 trong 7zip tạo ra kết quả khá chấp nhận được trong ít thời gian nhất.


Có gì khác khi sử dụng PeaZip? Nó chỉ là một trình bao bọc GUI khoảng 7zip và nhiều công cụ khác
Cole Johnson

@Cole "Cole9" Johnson Sự khác biệt là trong trường hợp của tôi, tôi đã sử dụng một số công cụ "khác" từ PeaZip không có GUI tại thời điểm đó. Nếu tôi nhớ chính xác thì chỉ có PeaZip cung cấp thuật toán PAQ8O với GUI.
AndrejaKo

Câu trả lời:


8

Nội dung của các tệp PDF (văn bản & hình ảnh) có thể đã được nén - vì vậy sẽ không có nhiều để đạt được bằng cách cố gắng nén chúng một lần nữa.


3
Ồ không. Tôi đã thử nghiệm một chút và lấy 24MiB PDF và nén chúng bằng các cài đặt mặc định. Kết quả là một tập tin 19 MiB. Trong trường hợp của tôi, 5 MiB đó có vấn đề trong trường hợp của tôi.
AndrejaKo

1
Có vẻ như bạn đúng. Tôi không thể tạo ra kết quả tốt hơn đáng kể so với 7zip mặc dù tôi đã làm gì. Tôi vẫn tin rằng một số nén tốt hơn không.
AndrejaKo

3
Nếu bạn có thể tiết kiệm được nhiều dung lượng đó, thì có lẽ công việc có thể được thực hiện với chính các tệp PDF để tiết kiệm gần như toàn bộ không gian đó mà không cần 7-Zip. Một chuyến đi qua Trình tối ưu hóa PDF của Acrobat có thể làm việc kỳ diệu.
afrazier

Xem câu trả lời của usr - nén được sử dụng trong PDF (zlib) có thể được hoàn nguyên để nén chúng thêm (và áp dụng lại khi tái thiết). Điều này thường dẫn đến giảm ~ 50% kích thước
schnaader

@schnaader: Điều đó thực sự thú vị. Tôi đã thấy và sử dụng các công cụ như Trình tối ưu hóa PDF và MuPDF của Acrobat để sửa đổi các tệp PDF trong khi giữ cho chúng có thể xem được, nhưng có thể biến đổi chúng một cách dễ dàng như thế cũng rất có giá trị và có thể được sử dụng để tạo lợi thế lớn.
afrazier

7

Hãy thử trước - trước tiên giải nén dữ liệu đã được nén bên trong các tệp PDF của bạn. Sau đó, 7z có thể làm điều kỳ diệu của nó trên dữ liệu không nén.

Ngoài ra, hãy thử nanozip mà tôi đã xác minh là rất hiệu quả, nhưng rất hiệu quả (400kb / giây ở tỷ lệ nén của thuật toán PAQ).


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 tên tệp.7z

Điều chỉnh từ đầu tiên cần thiết cho tên của dòng lệnh thực thi của bạn và điều chỉnh các phần sau "-mpass = 15" để tùy chỉnh tên tệp của bạn và những gì cần bao gồm.

Câu trả lời này không dành riêng cho tài liệu PDF.
Điều này sử dụng LZMA, không phải PPM. Tôi đã tránh xa PPM vì có quá nhiều biến thể không tương thích với các biến thể khác. LZMA có vẻ ổn định hơn, khả năng tương thích được hỗ trợ rộng rãi hơn. Vì vậy, tôi đã tránh xa PPM chính xác bởi vì ý kiến ​​của tôi là, như bạn đã nói, "nỗ lực cần thiết để sử dụng các thuật toán nén kỳ lạ là không hợp lý."


2
LZMA2 tốt hơn đáng kể so với LZMA nhưng chỉ dành cho (hiệu quả) trên các hệ thống 64 bit.
OMY

-3

nén lzma là tốt nhất vì bạn có thể tạo tệp sfx hoặc gói msi với tỷ lệ nén cao. trong trường hợp của bạn, bạn không nén một tệp lớn nên độ chênh lệch khá nhỏ đặc biệt là nếu tệp đã được nén, chẳng hạn như: mp3 hoặc png

Hãy thử win arc nó miễn phí và cho tỷ lệ nén gret

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.