Hellinger Khoảng cách là gì và khi nào sử dụng nó?


19

Tôi muốn biết những gì thực sự xảy ra trong Hellinger Khoảng cách (nói một cách đơn giản). Hơn nữa, tôi cũng quan tâm đến việc biết các loại vấn đề mà chúng ta có thể sử dụng Hellinger Khoảng cách là gì? Những lợi ích của việc sử dụng Hellinger Khoảng cách là gì?


9
Khoảng cách Hellinger là một tương tự xác suất của khoảng cách Euclide. Một đặc tính nổi bật là tính đối xứng của nó, như là một số liệu. Các thuộc tính toán học như vậy rất hữu ích nếu bạn đang viết một bài báo và bạn cần một hàm khoảng cách sở hữu các thuộc tính nhất định để làm cho bằng chứng của bạn có thể. Trong ứng dụng, ai đó có thể phát hiện ra rằng một số liệu tạo ra kết quả đẹp hơn hoặc tốt hơn so với số liệu khác cho một nhiệm vụ nhất định; ví dụ: khoảng cách Wasserstein là tất cả các cơn thịnh nộ trong các mạng đối nghịch thế hệ
Emre

Cảm ơn bạn đã bình luận. Tôi bắt gặp câu hỏi này, nó khá giống với câu hỏi tôi có bây giờ. datascience.stackexchange.com/questions/22324/ Hãy xin vui lòng cho tôi biết, tại sao câu trả lời nói Hellinger Khoảng cách là phù hợp?
Smith Volka

2
Có lẽ để hình dung các chủ đề trong một không gian số liệu. Một đặc tính tốt khác là khoảng cách Hellinger là hữu hạn cho các bản phân phối với sự hỗ trợ khác nhau. Thật tốt khi bạn hỏi những câu hỏi này. Tôi đề nghị thử các số liệu khác nhau cho bản thân và quan sát kết quả.
Emre

Cảm ơn. đó là một liên kết tốt. giúp đỡ rất nhiều. Nhưng khoảng cách Hellinger chỉ giới hạn trong các chủ đề bắt nguồn từ Phân bổ Dirichlet tiềm ẩn (LDA) như được đề cập trong liên kết?
Smith Volka

1
Không, nó không có kết nối vốn có với LDA.
Emre

Câu trả lời:


7

Khoảng cách Hellinger là một thước đo để đo sự khác biệt giữa hai phân phối xác suất. Nó là tương tự xác suất của khoảng cách Euclide .

Cho hai phân phối xác suất, và , khoảng cách Hellinger được xác định là:PQ

h(P,Q)=12PQ2

Nó rất hữu ích khi định lượng sự khác biệt giữa hai phân phối xác suất. Ví dụ: nếu bạn ước tính phân phối cho người dùng và người dùng không sử dụng dịch vụ. Nếu khoảng cách Hellinger nhỏ giữa các nhóm đối với một số tính năng, thì các tính năng đó không hữu ích về mặt thống kê cho phân khúc.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.