Từ quan điểm ít chính thức hơn, tôi nghĩ có thể hữu ích nếu bạn tách mình khỏi từ "ngẫu nhiên", vì bạn đúng rằng một tập hợp các bit thực sự ngẫu nhiên không lưu trữ bất kỳ thông tin nào theo nghĩa thực tế. (Nếu tôi mã hóa một tập hợp các tên và gửi các giá trị được mã hóa cho bạn, chúng có thể có độ phức tạp Kolmogorov rất cao nhưng nó sẽ không giúp bạn tìm ra các tên đó).
Nhưng hãy nghĩ về nó theo cách này. Nếu bạn thấy một trang web bằng tiếng nước ngoài (nói tiếng Thụy Điển, giả sử bạn không nói nó) thì nó sẽ trông ít nhiều ngẫu nhiên. Sẽ có một số thứ tự cho các từ, nhưng không nhiều. Tuy nhiên, nếu bạn xem một trang web có văn bản giống như thế này: 123456123456123456123456 ... và cứ thế, bạn sẽ có thể hiểu nó nhanh hơn. Nếu bạn không nói tiếng Thụy Điển, có lẽ bạn sẽ có thể tận dụng được nhiều hơn từ nó, ngay cả khi trang web của Thụy Điển nói tương đương với "sáu số đầu tiên được lặp lại liên tục". Các trang web chứa thông tin tương tự, nhưng một cái nhìn ngẫu nhiên với bạn. Và đối với dung lượng, trang bạn hiểu là kém hiệu quả hơn trang web của Thụy Điển, mặc dù nó lưu trữ thông tin tương tự. Bạn có thể không thấy thông tin này "hữu ích" vì nó '
Khái niệm "thông tin" có nghĩa là phổ quát, vì vậy những gì trông giống như ngẫu nhiên - và do đó vô dụng - các bit đối với bạn có thể lưu trữ rất nhiều thông tin cho người khác. Thước đo thông tin được dự định là một thuộc tính nội tại của chuỗi và không thể phụ thuộc vào những gì không và không có ý nghĩa với bạn, và những gì bạn có thể và không thể giải thích.
Một điểm khác (kỹ thuật hơn) có thể giúp ích là tôi hơi bất cẩn ở đây. Như Juho chỉ ra, thông tin làđịnh nghĩa liên quan đến người giải thích nó. Bạn có thể thấy trang web của Thụy Điển hoàn toàn vô dụng như một phương tiện thông tin, nhưng ai đó nói tiếng Thụy Điển có thể thấy nó có rất nhiều thông tin. Định nghĩa không phản ánh điều này. Tuy nhiên, từ toán học, chúng ta có thể biết rằng sự khác biệt giữa trang web ngắn nhất (nhiều thông tin nhất cho không gian) để truyền đạt trang web này đến bạn và trang web ngắn nhất có thể giao tiếp với người nói tiếng Thụy Điển chỉ có thể khác nhau bởi hằng số phụ gia. Tại sao? Bởi vì đối với bạn, là một người không nói tiếng Thụy Điển, cách ngắn nhất để lưu trữ trang mà bạn có thể hiểu là "sáu số nguyên đầu tiên được lặp lại liên tục". Điều này có thể dài hơn một chút so với Thụy Điển.
Nhưng ngay cả khi bạn có thể nói tiếng Thụy Điển, bạn chỉ có thể cắt hằng số phụ gia từ độ dài! Tại sao? Bởi vì bạn luôn có thể đi mua một từ điển Thụy Điển-Anh. Sau đó, các trang web Thụy Điển siêu ngắn sẽ có ý nghĩa với bạn. Chắc chắn, chúng chỉ có ý nghĩa khi bạn có từ điển, nhưng từ điển có độ dài không đổi. Vì vậy
(Most efficient representation of information in English)≤(Most efficient representation in Swedish)+(Length of Swedish-English dictionary)
. Điều này nhận được một chút lạc đề từ câu hỏi ban đầu của bạn, nhưng điểm tôi đang cố gắng đưa ra là nó không quan trọng quá nhiều người đang đọc thông tin. Trang web Thụy Điển trông ngẫu nhiên không "hữu ích" với bạn, nhưng nó "hữu ích" với người khác và bạn chỉ có một lượng thông tin không thể tự mình sử dụng.