Một khách hàng đang cố gửi cho tôi tệp có giá trị 250 GB. Sau khi thử nhiều cách chia sẻ dữ liệu, anh ấy đã gửi cho tôi một thư mục nén chỉ có kích thước 4 GB. Nghe có vẻ như quá sức nén đối với tôi - Tôi không nghĩ khi tôi nén những thứ tôi từng giảm hơn 20% kích thước.
Một số tỷ lệ nén không tổn thất điển hình mà người ta sẽ thấy trong thực tế là gì? (Hoặc cách khác, một phạm vi.)
CẬP NHẬT: Tôi nhận ra không thể nói mà không thể đoán được nội dung thông tin thực tế, vì vậy có lẽ đây là một câu hỏi không hay. Tôi không thể chia sẻ dữ liệu của khách hàng. Nhưng nhìn vào các XML
tập tin, có rất nhiều cụm từ lặp đi lặp lại, vd
<thing>
<property="1" value="2" />
<property="3" value="4" />
<property="5" value="6" />
<property="7" value="8" />
<property="9" value="10" />
<property="11" value="12" />
<property="13" value="14" />
</thing>
mà dường như khá nén.
1000000000 null bytes
sẽ là tỷ lệ nén 50.000.000: 1.)