Khoảng cách Hellinger là một thước đo để đo sự khác biệt giữa hai phân phối xác suất. Nó là tương tự xác suất của khoảng cách Euclide .
Cho hai phân phối xác suất, và , khoảng cách Hellinger được xác định là:PQ
h(P,Q)=12–√⋅∥P−−√−Q−−√∥2
Nó rất hữu ích khi định lượng sự khác biệt giữa hai phân phối xác suất. Ví dụ: nếu bạn ước tính phân phối cho người dùng và người dùng không sử dụng dịch vụ. Nếu khoảng cách Hellinger nhỏ giữa các nhóm đối với một số tính năng, thì các tính năng đó không hữu ích về mặt thống kê cho phân khúc.