Thực sự, thực tế là các tập tin đã được nén không phải là vấn đề quan trọng. Đây là: nén nói chung chỉ có thể hoạt động nếu dữ liệu có một số loại dư thừa trong đó . Đó là thực tế luôn luôn như vậy cho các tập tin nén - tuy nhiên, nó không nhất thiết phải rõ ràng những gì dư thừa là. Các thuật toán nén cho mục đích chung chủ yếu nhắm vào loại điều rõ ràng trong các tệp văn bản: nhiều từ xuất hiện không chỉ một lần mà nhiều lần ở dạng giống hệt nhau, có lẽ các cụm từ có thể được kết hợp, v.v. Các thuật toán khá tốt trong khái quát hóa điều này với bất cứ điều gì từ danh sách số điện thoại được mã hóa ASCII qua thơ Trung Quốc sang mã máy nhị phân, nhưng chúng không thể hoạt động với bất kỳ loại dữ liệu nào. Cụ thể, các tập tin phương tiện là khái niệmdữ liệu tương tự , trong một đại diện kỹ thuật số ồn ào. Điều đó có nghĩa là, thực sự không có bất kỳ loại khử văn bản nào cả: một số động cơ có thể được lặp lại, nhưng luôn có cấu hình nhiễu cảm biến hơi khác. Đó là lý do tại sao tất cả các định dạng AV / hình ảnh nén sử dụng một số phép biến đổi được chọn khéo léo làm bước mã hóa đầu tiên của chúng, thường dựa trên DCT hoặc wavelet . Các phép biến đổi này nói một cách đại khái là di chuyển các phần hình ảnh và các phần nhiễu vào các vị trí khác nhau, do đó chúng có thể được tách biệt và với tính năng nén mất mát, bạn chỉ giữ lại thông tin mà bạn cho là quan trọng nhất, không bao gồm nhiễu, trong khi " thông tin tốt "có rất nhiều dư thừa. (Đó không thực sự là cách nó hoạt động, nhưng loại.)
Nếu máy nén đa năng sử dụng các phép biến đổi này, thì hiệu ứng sẽ ngược lại: hầu hết thông tin kỹ thuật số thực sự sẽ bị phân loại sai thành một loại nhiễu, vì nó thiếu cấu trúc "mịn" mà bạn tìm thấy trong các tín hiệu tương tự. Và sau khi nén video bị mất rõ ràng, không thể tìm thấy độ mượt tương tự hoặc tái phát kỹ thuật số nữa (nếu có, các codec sẽ sử dụng một giai đoạn bzip khác hoặc chính chúng!)