KullbackTHER Leibler vs Kolmogorov-Smirnov khoảng cách


37

Tôi có thể thấy rằng có rất nhiều sự khác biệt chính thức giữa các biện pháp khoảng cách Kullback Mitch Leibler vs Kolmogorov-Smirnov. Tuy nhiên, cả hai đều được sử dụng để đo khoảng cách giữa các bản phân phối.

  • Có một tình huống điển hình mà một người nên được sử dụng thay vì khác?
  • Lý do để làm như vậy là gì?

Câu trả lời:


23

Ví dụ, phân kỳ KL thường được sử dụng trong các cài đặt lý thuyết thông tin, hoặc thậm chí các cài đặt Bayes, để đo lường sự thay đổi thông tin giữa các phân phối trước và sau khi áp dụng một số suy luận. Đó không phải là một khoảng cách theo nghĩa (số liệu) điển hình, vì thiếu bất đẳng thức đối xứng và tam giác, và vì vậy nó được sử dụng ở những nơi có tính định hướng.

Khoảng cách KS thường được sử dụng trong bối cảnh thử nghiệm không tham số. Trên thực tế, tôi hiếm khi thấy nó được sử dụng như một "khoảng cách giữa các bản phân phối" chung chung, trong đó khoảng cách , khoảng cách Jensen-Shannon và các khoảng cách khác là phổ biến hơn.1


5
Một cách sử dụng khác của phân kỳ KL đáng được đề cập là trong thử nghiệm giả thuyết. Giả sử là các biện pháp có mật độ hoặc . Đặt . Bởi Neyman - Pearson, một thử nghiệm tối ưu từ chối khi lớn. Bây giờ, theo , xác suất và theo , . Vì là không âm, nên hàm ý là sử dụng quy tắc để từ chối là hoàn hảo không có triệu chứng.X1,X2,Giáo dụcp0p1Tn= =n-1Σtôi= =1nđăng nhập(p1(Xtôi)/p0(Xtôi))Tnp0Tn-D(p0||p1)p1TnD(p1||p0)D(||)Tn>0p0
Đức hồng y

Thật. đó là một ví dụ tuyệt vời Và trên thực tế, hầu hết các phiên bản chung của giới hạn đuôi Hooff-Hoeffding đều sử dụng phân kỳ KL.
Suresh Venkatasubramanian

2

Một cách khác để nói điều tương tự như câu trả lời trước đó trong các điều khoản giáo dân nhiều hơn:

Phân kỳ KL - Trên thực tế cung cấp một thước đo về mức độ lớn của sự khác biệt là hai phân phối từ nhau. Như đã đề cập trong câu trả lời trước, biện pháp này không phải là một thước đo khoảng cách thích hợp vì nó không đối xứng. Tức là khoảng cách giữa phân phối A và B là một giá trị khác với khoảng cách giữa phân phối B và A.

Kiểm tra Kolmogorov-Smirnov - Đây là một số liệu đánh giá xem xét sự phân tách lớn nhất giữa phân phối tích lũy của phân phối thử nghiệm so với phân phối tham chiếu. Ngoài ra, bạn có thể sử dụng số liệu này giống như chỉ số z so với phân phối Kolmogorov để thực hiện kiểm tra giả thuyết về việc phân phối thử nghiệm có phân phối giống như tham chiếu hay không. Số liệu này có thể được sử dụng như một hàm khoảng cách vì nó là đối xứng. Tức là sự phân tách lớn nhất giữa CDF của A so với CDF của B cũng giống như sự phân tách lớn nhất giữa CDF của B so với CDF của A.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.