Lý lịch
Trong số 256 ký tự có thể mà một byte có thể biểu thị, chỉ một vài trong số này được sử dụng trong hầu hết các trường hợp. Chúng ta không thể bằng cách nào đó tận dụng lợi thế này và làm cho các tệp văn bản của chúng ta nhỏ hơn bằng cách loại bỏ sự cần thiết của các chữ cái hiếm khi được sử dụng?
Nhiều chữ cái không thêm bất kỳ giá trị nào trong hầu hết các tình huống và có thể được thay thế bằng các chữ cái phổ biến hơn. Ví dụ: chữ "L" viết thường, viết hoa "I" và số "1" trông gần giống nhau trong hầu hết các tình huống, vì vậy chúng có thể được hợp nhất.
Có rất ít nhu cầu về chữ in hoa, vì vậy chúng có thể được phân phối. Chương trình giải nén / hiển thị thậm chí có thể tự động viết hoa chữ cái đầu tiên của mỗi câu, tên thông thường, v.v.
Quy tắc
Bài dự thi sẽ được đánh giá trên:
- tỷ lệ nén
- khả năng đọc sau khi nén
Các bài dự thi sẽ được kiểm tra dựa trên phiên bản văn bản đơn giản của bài viết này: http://en.wikipedia.org/wiki/Babbage và một bài báo được chọn ngẫu nhiên của BBC News .
Điểm thêm sẽ được trao cho; giữ bất kỳ đánh dấu, làm đẹp sau khi khử (nghĩa là viết hoa câu v.v.).
Ngôn ngữ
- Bất kỳ bạn thích, nhưng phải dễ dàng biên dịch (hoặc được giải thích) trên hộp * nix cơ bản.
main = interact (\x -> take 90 x ++ " yada yada yada")