Tôi có một vài bản phân phối (10 bản phân phối trong hình bên dưới).
Trong thực tế đây là các biểu đồ: có 70 giá trị trên trục x là kích thước của một số hạt trong một giải pháp và với mỗi giá trị của x, giá trị tương ứng của y là tỷ lệ các hạt có kích thước xung quanh giá trị của x.
Tôi muốn phân cụm các phân phối này. Hiện tại tôi sử dụng một cụm phân cấp với khoảng cách Euclide chẳng hạn. Tôi không hài lòng bởi sự lựa chọn của khoảng cách. Tôi đã thử khoảng cách lý thuyết thông tin như Kullback-Leibler nhưng có nhiều số không trong dữ liệu và điều này gây ra khó khăn. Bạn có một đề xuất về một khoảng cách thích hợp và / hoặc một phương pháp phân cụm khác không?