Các thuật toán phân cụm đồ thị xem xét các trọng số âm


8

Tôi có một thể hiện biểu đồ với các cạnh được định hướng có trọng số mà các giá trị có thể nằm trong phạm vi [-1,1]. Tôi cần phải phân cụm trên biểu đồ này, để tìm ra các nhóm trong đó các đỉnh có tương quan hơn.

Tôi đã tìm kiếm một số thuật toán dựa trên biểu đồ phân cụm hoặc phát hiện cộng đồng, nhưng hầu hết chúng không hoạt động vì các trọng số âm. Cho đến nay tôi đã áp dụng spinglass (nó được gọi là trong thư viện igraph , nó là một thuật toán dựa trên mô hình Potts) có vẻ như hoạt động với cả trọng số dương và âm.

Có bất kỳ thuật toán nào khác để thực hiện phân cụm hoặc phát hiện cộng đồng trên các biểu đồ có trọng số cạnh âm và dương không?

Cập nhật: các trọng số cạnh biểu thị các mối tương quan, 1 có nghĩa là hai đỉnh có tương quan mạnh, -1 có tương quan nghịch đảo và 0 có nghĩa là phụ thuộc.


Các trọng lượng đại diện cho những gì?
eliasah

@eliasah Tôi đã thực hiện một bản cập nhật để giải thích điều đó
Ewybe

Bạn đã thử sử dụng một quy mô khác? Đó có thể là một giải pháp tốt bằng cách sử dụng phương pháp phân cụm thông thường dựa trên thuật toán tính trung tâm giữa mỗi ví dụ.
eliasah

@eliasah Thu nhỏ những dữ liệu này không dễ dàng vì tôi quan tâm đến việc giữ nguyên ý nghĩa của mối tương quan
Ewybe

1
Đối với cụm, là dấu hiệu của mối tương quan thực sự cần thiết? Tương quan nghịch đảo là một mối quan hệ khá mạnh mẽ , quá. Xem câu trả lời của tôi dưới đây.
Có QUIT - Anony-Mousse

Câu trả lời:


2

Bạn đã thử ánh xạ các giá trị thành [0; 2] chưa?

Sau đó, nhiều thuật toán có thể hoạt động.

Ví dụ, hãy xem xét Dijkstra: nó yêu cầu trọng số cạnh không âm, nhưng nếu bạn biết mức tối thiểu acủa các cạnh, bạn có thể chạy nó x-avà có được con đường không có chu kỳ ngắn nhất.

Cập nhật: đối với các giá trị tương quan, bạn có thể quan tâm đến các giá trị tuyệt đối abs(x)(đó là điểm mạnh của tương quan!) Hoặc bạn có thể muốn chia biểu đồ thành hai tạm thời: chỉ cụm đầu tiên trên các tương quan dương, sau đó là tương quan âm chỉ khi dấu hiệu quan trọng đối với việc phân cụm & các cách tiếp cận trước đó không hoạt động.


Đó là bằng cách nào đó những gì tôi đã đề nghị, anh ấy nói rằng anh ấy sẽ "mất đi ý nghĩa của mối tương quan". Bạn nghĩ gì về điều này?
eliasah

Với mô tả được cập nhật của mình, abs (x) có thể hoạt động tốt hơn nữa.
Có QUIT - Anony-Mousse

Tuy nhiên tôi tin rằng [0,2] là đại diện hơn. Các biểu đồ có trọng số thường có tầm quan trọng rất lớn đối với các vấn đề này để tính toán tính tập trung, khoảng cách, đường kính, v.v.
eliasah

1
Điều đó không có nghĩa là bạn không thể phân biệt đối xử sau đó. Bạn đã thử nó, kết quả vẫn có thể hữu ích?
Có QUIT - Anony-Mousse

1
Sau đó thử phương pháp khác - tìm riêng cụm tích cực và tiêu cực.
Có QUIT - Anony-Mousse

1

Đúng, có một thuật toán gọi là 'Tuyên truyền về mối quan hệ' hoạt động với các trọng số âm; Tôi tin rằng điều này được thực hiện trong sklearn (xem tài liệu ở đây ). Một tài liệu tham khảo cho những gì đang diễn ra đằng sau hậu trường có thể được tìm thấy ở đây .

Hy vọng đó là những gì bạn đang tìm kiếm!


Tôi không biết thuật toán này, nó có vẻ là một giải pháp tốt. Tôi chắc chắn sẽ thử nó. Cảm ơn bạn.
Ewybe

Theo như tôi biết thì cụm Tuyên truyền về mối quan hệ sẽ không thể đồng thời xem xét các mối tương quan tích cực và tiêu cực trong khi cũng phân tách chúng. Đối với vấn đề đó, tôi nghĩ rằng nhiệm vụ là mâu thuẫn.
micans

0

Dường như với tôi, vấn đề bạn mô tả được gọi là Vấn đề phân cụm tương quan . Thông tin này sẽ giúp bạn tìm thấy một số triển khai, chẳng hạn như:

Lưu ý rằng một số thuật toán phát hiện cộng đồng cũng đã được sửa đổi để xử lý các mạng đã ký, ví dụ Amelio'13 , Sharma'12 , Anchuri'12 , v.v. Tuy nhiên, tôi không thể tìm thấy bất kỳ triển khai công khai nào.


0

Hãy xem mã này , nó có khả năng mở rộng, hoạt động với các cạnh tích cực và tiêu cực và giải quyết Phân cụm Tương quan (CC) như một trường hợp đặc biệt (r = 0). Tuy nhiên, đối với trường hợp CC (tối đa hóa các liên kết tích cực và giảm thiểu các liên kết tiêu cực bên trong các cụm), tôi sẽ đề xuất các phương pháp khác chuyên giải quyết mục tiêu này.

Để minh họa, Phân cụm Tương quan (không giống như những gì tài liệu Phát hiện Cộng đồng theo đuổi) không tính đến mật độ tích cực của các cụm, vì vậy khi một mạng không có hoặc có một vài mối quan hệ tiêu cực (hầu hết các trường hợp trong thế giới thực), tất cả các mạng đều được đưa vào một lớn cụm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.