Tôi có một bộ dữ liệu lớn và sự tương đồng cosin giữa chúng. Tôi muốn phân cụm chúng bằng cách sử dụng độ tương tự cosine để đặt các đối tượng tương tự lại với nhau mà không cần chỉ định trước số lượng cụm mà tôi mong đợi.
Tôi đọc tài liệu sklearn của DBSCAN và Tuyên truyền mối quan hệ, trong đó cả hai đều yêu cầu ma trận khoảng cách (không phải ma trận tương tự cosine).
Thực sự, tôi chỉ tìm kiếm bất kỳ thuật toán nào không yêu cầu a) số liệu khoảng cách và b) số cụm được chỉ định trước .
Có ai biết một thuật toán sẽ làm điều đó?