Có thể nén một tệp rất lớn (~ 30 GB) bằng gzip không?


17

Có thể nén một tệp rất lớn (~ 30 GB) bằng gzip không? Nếu vậy, tôi nên sử dụng các lệnh, công tắc và tùy chọn nào?

Hoặc có một chương trình khác (tốt nhất là một chương trình thường có trên các bản phân phối Ubuntu) mà tôi có thể sử dụng để nén / nén các tệp rất lớn? Bạn có bất kỳ kinh nghiệm với điều này?


Hầu hết các máy nén cứng là xz, hoặc phiên bản song song của nó, pxz. pxz -9ve - <in >out.xzvà bạn sẽ nướng một con gà trên PC của bạn, nhưng kết quả sẽ là khoảng 60% kết quả gzip. Bạn cần khoảng 7 GB cho điều đó.
peterh - Phục hồi Monica

Câu trả lời:


22

AFAIK không có giới hạn kích thước cho gzip- ít nhất không phải là 30 GB. Tất nhiên, bạn cần không gian cho tệp nén trên đĩa của mình, cả hai phiên bản sẽ ở đó đồng thời trong khi nén.

bzip2 nén các tệp (không chỉ các tệp lớn :-) tốt hơn, nhưng chậm hơn (đôi khi rất nhiều).


4
bzip2 đặc biệt tốt trong việc nén mã nguồn (và tương tự). Nó là một đối thủ cạnh tranh tốt để gzip để sử dụng chung. Tính khả dụng cho gzip trên các hệ điều hành khác nhau tốt hơn bzip2
jippie

Là nén nén bzip2? Cảm ơn.
Andrew

3
@Andrew Có, gzip / bzip2 / etc ... đều không mất dữ liệu.
Renan

1
Và cũng có pbzip- nó sẽ sử dụng nhiều hơn một lõi CPU. Nhưng vẫn chậm hơn gzip.
Nils

1
@Nils: trên Ubuntu của tôi chỉ cópbzip2
rubo77

8

Nếu bạn cần một tỷ lệ bù đắp tốt, bạn có thể thử lzma. nó nhanh hơn và hiệu quả hơn bzip2 và có thể nhanh hơn cả gzip (tôi không biết điều đó chắc chắn)

http: //www.thegeek ware.com/2010/06/lzma-better-compression-than-bzip2-on-unix-linux/


4
lzmaxzbây giờ không được ủng hộ Cùng một thuật toán, định dạng tệp hơi khác nhau (được cải thiện?) Bao quanh nó. LZMA chậm hơn gzip, nhưng ở tốc độ tối đa, nó vẫn nén khá tốt đối với những thứ dư thừa như dữ liệu JSON. ( xz -0)
Peter Cordes

3

Nếu bạn đang chạy vào giới hạn, sắp xếp lại. Thay vì:

gzip file

làm:

gzip < file > file.gz

Hoạt động tốt.


2

Định dạng gzip đại diện cho kích thước đầu vào modulo 2 ^ 32, do đó, --listtùy chọn báo cáo kích thước không nén và tỷ lệ nén không chính xác cho các tệp không nén 4 GB trở lên.

Vì vậy, lấy bzip2(v1.0.2 trở lên) hoặc xz.


Nếu nó chỉ chính xác là gzip, thì tệp của bạn phải được chia thành các phần nhỏ hơn lên đến 4 Gb mỗi phần.
chữ hình nêm

Có bộ chia tập tin có sẵn cho việc này.
Vérace 22/03/2016

Chà, không cần phải chia ra, chỉ là kích thước được báo cáo sẽ sai.
Luật29

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.