Có, nén không mất lợi dụng thực tế là nhiều tệp không phải là ngẫu nhiên. Có, hầu hết các tập tin đa phương tiện không phải là ngẫu nhiên.
Hình ảnh fax là một ví dụ tốt về hiệu ứng này. Ở dạng đơn giản nhất, hình ảnh fax là hình ảnh đen trắng 2 chiều, thu được bằng cách quét một trang của một số tài liệu. Nếu bạn biểu diễn hình ảnh này dưới dạng một chuỗi bit, một bit trên mỗi pixel (0 = trắng, 1 = đen), thì bạn sẽ phát hiện ra rằng dữ liệu nhị phân kết quả hoàn toàn không phải là ngẫu nhiên. Chẳng hạn, đây là một số mẫu không ngẫu nhiên bạn sẽ thấy:
Thông thường hình ảnh fax có nhiều pixel trắng hơn pixel đen.
Ngoài ra, mỗi pixel có nhiều khả năng có cùng màu với pixel ở bên trái hơn là có một màu khác nhau.
Đối với một mẫu phức tạp hơn: Hãy tưởng tượng quét các pixel theo chiều ngang, từ trái sang phải và đếm chiều dài của mỗi "lần chạy" của các pixel liên tiếp có cùng màu. Sau đó, chạy dài là phổ biến hơn so với chạy ngắn và chạy pixel dài màu phổ biến hơn so với chạy pixel đen dài.
Các thuật toán nén fax được thiết kế để tận dụng các khía cạnh không ngẫu nhiên này. Các thuật toán nén fax sớm là một ví dụ đặc biệt tốt, bởi vì chúng là các sơ đồ nén không mất dữ liệu đơn giản khai thác trực tiếp các thuộc tính không ngẫu nhiên này của các hình ảnh được quét.
Chẳng hạn, một sơ đồ ban đầu để nén ảnh fax được sử dụng mã hóa thời lượng chạy kết hợp với mã hóa Huffman . Mã hóa độ dài chạy thay thế mỗi lần chạy của các pixel cùng màu bằng một số nguyên duy nhất đếm chiều dài của lần chạy. Chẳng hạn, 00000110001 trở thành "5 2 3 1". Mã hóa độ dài chạy khai thác thực tế là các pixel có xu hướng chạy cùng màu. Mã hóa Huffman khai thác hơn nữa thực tế là một số độ dài chạy phổ biến hơn các mã khác. Xem ở đây để biết ví dụ chi tiết về cách một trong những sơ đồ ban đầu này hoạt động - sơ đồ này đơn giản và thanh lịch và trực tiếp khai thác các mẫu được đề cập ở trên.
Các lược đồ này sẽ không cung cấp bất kỳ nén, trung bình, cho các tệp ngẫu nhiên. Tuy nhiên, hình ảnh fax được quét không phải là ngẫu nhiên và do đó, các chương trình nén này có thể mang lại sự tiết kiệm đáng kể.
Nhận xét tương tự áp dụng cho các tập tin đa phương tiện khác. Các mẫu có trong các loại tệp đa phương tiện khác có thể phức tạp hơn, nhưng vẫn có nhiều mẫu hiện diện làm cho dữ liệu không ngẫu nhiên.