Tôi tự hỏi liệu ai đó có thể đề xuất điểm khởi đầu tốt là gì khi thực hiện phát hiện / phân vùng biểu đồ cộng đồng / phân cụm trên biểu đồ có các cạnh có trọng số , không có hướng . Biểu đồ trong câu hỏi có khoảng 3 triệu cạnh và mỗi cạnh biểu thị mức độ tương tự giữa hai đỉnh mà nó kết nối. Đặc biệt, trong tập dữ liệu này các cạnh là các cá thể và các đỉnh là thước đo cho sự giống nhau của hành vi được quan sát của chúng.
Trước đây, tôi đã làm theo một gợi ý tôi đã nhận được ở đây trên stats.stackexchange.com và đã sử dụng triển khai phân cụm mô đun của Newman và hài lòng với kết quả, nhưng đó là trên một tập dữ liệu không có trọng số.
Có bất kỳ thuật toán cụ thể nào tôi nên xem xét?