Giá trị thực tế của sự dư thừa trong các tệp zip là gì?


9

Làm thế nào là sự dư thừa được thực hiện trong nén, và làm thế nào để tôi hưởng lợi từ nó?

Tôi giả sử nó bao gồm một cái gì đó giống như lưu trữ các bảng tra cứu hai lần để một lỗi duy nhất không làm mất hiệu lực toàn bộ phần còn lại của tệp. Liên quan đến trường hợp sử dụng, có thể khi lưu trữ tệp trên đĩa CD bị trầy xước nhẹ?

Tuy nhiên, cá nhân tôi không bao giờ có bất kỳ lợi nhuận nào từ việc thêm dự phòng vào các tệp zip và tôi có xu hướng bỏ qua chúng, vì vậy tôi đã tự hỏi liệu chúng có thực sự hữu ích trong thực tế hay không.


CD sử dụng loại dự phòng riêng của họ để bù đắp cho các vết trầy xước, v.v., nó được gọi là điều chế tám đến mười bốn. Tôi nghĩ trường hợp sử dụng tốt hơn sẽ là các bản tải xuống bị hỏng vì bất kỳ lý do gì.
slhck

Câu trả lời:


1

Tôi tin rằng bạn đang nói về thuật toán thích ứng LZ. Nó không được gọi là dư thừa vì bất cứ điều gì bị trùng lặp trong quá trình xây dựng tệp zip. Thuật ngữ này xuất phát từ cách phương pháp nén này hoạt động.

Để minh họa, đây là một ví dụ. Hãy nói rằng tôi đã có một tài liệu có chứa cụm từ:

It is what it is because that's what it is

Nếu tôi muốn làm cho cụm từ này ngắn hơn thông qua dự phòng, trước tiên tôi sẽ tạo một từ điển chứa tất cả các từ được lặp lại, như vậy

1it
2is
3what

Và sau đó tôi sẽ viết lại câu như

12312becausethats312 

Nếu sau đó tôi muốn nén nó xa hơn tôi có thể thêm các mục sau vào từ điển của mình:

312x
12y

Vì vậy mà nó trở thành

yxbecausethatsx

Như bạn có thể thấy, càng nhiều kiểm tra dự phòng bạn càng trải qua quá trình nén càng lớn. Nhưng bạn cũng đang gia tăng khả năng tham nhũng. Điều này là do khi từ điển phát triển, nó trở nên dễ bị hư hại hơn và nếu bất kỳ phần nào trong từ điển bị hỏng thì phần còn lại không thể đọc được.


2
Tôi nghĩ rằng đây không phải là ý tôi. Tôi đã nói về tùy chọn để thêm thông tin phục hồi. Tính năng này có thể không tồn tại ở định dạng zip cổ điển.
mafu

2
Câu trả lời hay cho một câu hỏi khác: /
endolith
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.