Trước hết, việc vi phạm điều kiện đối xứng là vấn đề nhỏ nhất với phân kỳ Kullback - Leibler. cũng vi phạm bất đẳng thức tam giác. Bạn có thể chỉ cần giới thiệu phiên bản đối xứng là , nhưng đó vẫn không phải là số liệu, vì cả và vi phạm bất đẳng thức tam giác. Để chứng minh rằng chỉ cần lấy ba đồng xu A, B & C thiên vị tạo ra ít đầu hơn nhiều so với đuôi, ví dụ: đồng xu có xác suất đầu: A = 0,1, B = 0,2 và C = 0,3. Trong cả hai trường hợp, phân kỳ KL thường xuyên D hoặc SKL phiên bản đối xứng của nó, hãy kiểm tra xem chúng không có bất đẳng thức tam giác đầy đủ
D(P||Q)
SKL(P,Q)=D(P||Q)+D(Q||P)
D(P||Q)SKL(P,Q)D(A||B)+D(B||C)D(A||C)
SKL(A,B)+SKL(B,C)SKL(A,C)
Chỉ cần sử dụng công thức này:
D(P||Q)=∑ipi⋅log(piqi)
SKL(P,Q)=∑i(pi−qi)⋅log(piqi)
D(A||B)=0.1⋅log(0.10.2)+0.9⋅log(0.90.8)≈0.0159
D(B||C)≈0.0112
D(A||C)≈0.0505
0.0159+0.01120.0505
SKL(A,B)≈0.0352
SKL(B,C)≈0.0234
SKL(A,C)≈0.1173
0.0352+0.02340.1173
Tôi đã giới thiệu ví dụ này trong mục đích. Hãy tưởng tượng rằng bạn đang ném một số đồng tiền, ví dụ 100 lần. Miễn là đồng tiền này không thiên vị, bạn chỉ cần mã hóa kết quả tung với chuỗi 0-1 bit, (1 đầu, 0 đuôi). Trong tình huống như vậy khi xác suất đầu giống như xác suất đuôi và bằng 0,5, đó là một mã hóa khá hiệu quả. Bây giờ, chúng tôi có một số đồng xu thiên vị, vì vậy chúng tôi muốn mã hóa các kết quả có khả năng hơn với mã ngắn hơn, ví dụ: hợp nhất các nhóm đầu và đuôi và biểu diễn chuỗi các đầu k với mã dài hơn chuỗi k đuôi (chúng có nhiều khả năng hơn). Và ở đây xảy ra phân kỳ Kullback-Leibler . Nếu P đại diện cho phân phối kết quả thực sự và Q chỉ là xấp xỉ của P, thìD(P||Q)D(P||Q) biểu thị hình phạt bạn phải trả khi bạn mã hóa kết quả thực sự đến từ P distrib với mã hóa dành cho Q (hình phạt theo nghĩa của các bit thừa bạn cần sử dụng).
Nếu bạn chỉ cần số liệu, hãy sử dụng khoảng cách Bhattacharyya (tất nhiên phiên bản đã sửa đổi )1−[∑xp(x)q(x)−−−−−−−√]−−−−−−−−−−−−−−−√