Sau nhiều lần thử nghiệm Xác thực chéo, tôi vẫn không cảm thấy mình gần gũi hơn với việc hiểu phân kỳ KL ngoài phạm vi của lý thuyết thông tin. Thật kỳ lạ khi ai đó có nền tảng Toán học để tìm hiểu giải thích lý thuyết thông tin dễ dàng hơn nhiều.
Để phác thảo sự hiểu biết của tôi từ một nền tảng lý thuyết thông tin: Nếu chúng ta có một biến ngẫu nhiên với số lượng kết quả hữu hạn, thì tồn tại một mã hóa tối ưu cho phép chúng ta trao đổi kết quả với một người khác với thông điệp ngắn nhất (tôi thấy điều này dễ nhất hình ảnh về các bit). Độ dài dự kiến của tin nhắn người ta sẽ cần để truyền đạt kết quả được đưa ra bởi
Tôi thích cách giải thích này, bởi vì nó khá trực quan đối phó với sự bất đối xứng của phân kỳ KL. Nếu chúng ta có hai hệ thống khác nhau, tức là hai đồng tiền được tải khác nhau, chúng sẽ có các bảng mã tối ưu khác nhau. Tôi không bằng cách nào đó cảm thấy theo bản năng rằng việc sử dụng mã hóa của hệ thống thứ hai cho lần đầu tiên là "tệ như nhau" đối với việc sử dụng mã hóa của hệ thống thứ nhất cho lần thứ hai. Mà không phải trải qua quá trình suy nghĩ như thế nào tôi thuyết phục bản thân mình, Tôi bây giờ khá hạnh phúc vì
Tuy nhiên, hầu hết các định nghĩa về phân kỳ KL, bao gồm Wikipedia sau đó đưa ra tuyên bố (giữ điều này theo các thuật ngữ riêng biệt để có thể so sánh với cách giải thích lý thuyết thông tin hoạt động tốt hơn nhiều về mặt rời rạc vì các bit rời rạc) rằng nếu chúng ta có hai xác suất rời rạc phân phối, sau đó KL cung cấp một số số liệu "chúng khác nhau như thế nào". Tôi vẫn chưa thấy một lời giải thích duy nhất về cách hai khái niệm này thậm chí có liên quan với nhau. Tôi dường như nhớ trong cuốn sách về suy luận của mình, Dave Mackay đưa ra quan điểm về cách nén dữ liệu và suy luận về cơ bản là giống nhau, và tôi nghi ngờ câu hỏi của tôi thực sự liên quan đến vấn đề này.
Bất kể đó là hay không, loại câu hỏi tôi có trong đầu là xung quanh các vấn đề suy luận. (Giữ mọi thứ riêng biệt), nếu chúng ta có hai mẫu phóng xạ và chúng ta biết rằng một trong số chúng là một vật liệu nhất định có phóng xạ đã biết (đây là vật lý đáng ngờ nhưng hãy giả vờ vũ trụ hoạt động như vậy) và do đó chúng ta biết phân phối "thật" các nhấp chuột phóng xạ, chúng ta nên đo lường bằng poissonia , nó là công bằng để xây dựng một phân phối thực nghiệm cho cả hai mẫu và so sánh sự chênh lệch KL của họ để phân phối biết và nói rằng thấp hơn là nhiều khả năng được tài liệu nào?
Tránh xa vật lý đáng ngờ, nếu tôi biết hai mẫu được lấy từ cùng một phân phối nhưng tôi biết chúng không được chọn ngẫu nhiên, sẽ so sánh các phân kỳ KL của chúng với phân phối toàn cầu đã biết, cho tôi cảm giác về các mẫu "thiên vị" như thế nào , liên quan đến cái này và cái khác nào?
Và cuối cùng, nếu câu trả lời cho các câu hỏi trước là có, thì tại sao? Có thể hiểu những điều này từ quan điểm thống kê một mình mà không thực hiện bất kỳ kết nối (có thể khó khăn) nào với lý thuyết thông tin?