Do mật độ giới hạn của các điểm rời rạc , nên việc giải thích
không thể khái quát thành
S=−∑xp(x)lnp(x)
S=−∫dx(p(x)lnp(x))
Bởi vì việc khái quát hóa trực tiếp dẫn đến
Rõ ràng, phát nổ.
S=−∫dxp(x)ln(p(x)dx)=−∫dxp(x)ln(p(x))−∫dxp(x)ln(dx)
lndx
Theo trực giác, vì , do đó, lý do sử dụng ít bit hơn để mã hóa thứ gì đó có nhiều khả năng xảy ra không giữ được . Vì vậy, chúng ta cần tìm một cách khác để giải thích , và lựa chọn là phân kỳ .p(x)dx=0S=−∫dxp(x)ln(p(x)dx)KL
Giả sử chúng ta có phân phối đồng đều trong cùng một không gian trạng thái, thì chúng ta có
Vì chỉ là hằng số, vì vậy chúng tôi giữ nguyên dạng và đồng thời xây dựng một đại lượng được xác định rõ ràng cho phân phối liên tục .q(x)
KL(p(x)∥q(x))=∫dxp(x)ln(p(x)dxq(x)dx)
q(x)S=−∫dx(p(x)ln(p(x)dx))p(x)
Vì vậy, từ phân kỳ , entropy của phân phối liên tục có thể được hiểu là:KLp(x)
Nếu chúng ta sử dụng phân phối đồng đều để mã hóa , thì trung bình có bao nhiêu bit không cần thiết.p(x)