Về cơ bản, mục tiêu của phương pháp phân cụm đồ thị và phát hiện cộng đồng là tính toán các cụm. Có sự khác biệt nào giữa chúng không?
Về cơ bản, mục tiêu của phương pháp phân cụm đồ thị và phát hiện cộng đồng là tính toán các cụm. Có sự khác biệt nào giữa chúng không?
Câu trả lời:
Không. Trích dẫn ví dụ từ phát hiện Cộng đồng trong các biểu đồ , một khảo sát gần đây và rất hay của Santo Fortunato, "Tính năng này của các mạng thực sự được gọi là cấu trúc cộng đồng (Girvan và New- man, 2002) hoặc phân cụm". Có rất ít điểm trong việc xây dựng thêm điểm, thực sự. Tôi có cảm giác rằng trong các bài viết về phong cách phân tích mạng xã hội ban đầu, các mạng có xu hướng đơn giản (không có trọng số), nhưng đó không phải là điều tôi muốn tranh luận, cũng không quan trọng. Câu trả lời cho câu hỏi của bạn là không.
Trong Phát hiện cấu trúc cộng đồng trong mạng , M.Newman định nghĩa phân cụm biểu đồ là một vấn đề cụ thể được xác định trong bối cảnh khoa học máy tính.
Chúng ta hãy xem xét một số tính toán, có thể được phân chia trong một số hoạt động đơn giản hơn. Chúng được biểu diễn dưới dạng các nút trong mạng của chúng tôi. Các liên kết tương ứng với các phụ thuộc giữa các hoạt động, tức là kết quả của một hoạt động là cần thiết bởi một hoạt động khác. Vấn đề bao gồm phân phối các hoạt động trên một số bộ xử lý, cho các mục đích xử lý song song. Nói cách khác, chúng tôi muốn gán từng nút (hoạt động) cho một lớp (bộ xử lý) cụ thể, tức là chúng tôi muốn phân vùng biểu đồ.
Có ba hạn chế, mặc dù. Đầu tiên là để có được số lượng cộng đồng được xác định trước, bởi vì số lượng bộ xử lý rõ ràng được biết trước. Thứ hai là để có được một tải cân bằng: chúng tôi muốn mỗi bộ xử lý thực hiện gần như cùng một số lượng hoạt động. Về mặt biểu đồ, chúng tôi muốn các cộng đồng chứa khoảng cùng số nút. Thứ ba là để có được giao tiếp thấp nhất có thể giữa các bộ xử lý, vì nó làm chậm quá trình. Vì vậy, về mặt biểu đồ, chúng tôi muốn giảm thiểu số lượng liên kết giữa các cộng đồng.
Vì vậy, từ quan điểm này, phát hiện cộng đồng có thể được coi là một vấn đề chung hơn so với phân cụm đồ thị. Ràng buộc thứ ba được thi hành trong cả hai vấn đề, nhưng số lượng và quy mô của các cộng đồng không được biết đến trong một phát hiện cộng đồng.
Hai tên khác nhau được đặt cho cùng một điều bởi các cộng đồng các nhà khoa học khác nhau, tùy thuộc vào việc người ta có muốn nhấn mạnh động lực của mạng xã hội hay không. Có lẽ ai đó đang xác định phân cụm và phát hiện cộng đồng là những thứ khác nhau, nhưng hầu hết những người nghiên cứu một trong số họ sẽ không thể cho bạn biết lý do tại sao họ không sử dụng thuật ngữ khác.
Nếu một mạng lớn được chia thành hai phần, điều gì đảm bảo cho bạn rằng hai phần này là hai cộng đồng? Hai cụm có kết nối thấp không có nghĩa là mỗi cụm có loại nút hoặc nút tương tự có loại kết nối tương tự (do đó là cộng đồng). Hãy nghĩ về đồ thị mạng xã hội. Chắc chắn có rất nhiều cộng đồng. Cũng bằng cách phân cụm thuật toán, bạn có thể phân cụm thành hai phần. Trong trường hợp này, bạn sẽ gọi mỗi phần là một cộng đồng. ? Câu trả lời của tôi là không. Bởi vì, hai cụm có thể là người của hai khu vực địa lý. Và sau đó chắc chắn không phải là cộng đồng.
Các thuật toán phân cụm chỉ quan tâm đến việc cắt tối thiểu, không phải về độ tương tự nút hoặc độ tương tự kết nối hoặc kết nối dày đặc. Cộng với các thuật toán phân cụm, số lượng các cụm nên được xác định trước.
Các thuật toán phát hiện cộng đồng, họ quan tâm đến mật độ, họ tìm thấy phần dày đặc hơn của mạng và các loại thuật toán đó (tôi đã thấy cho đến nay) không cần xác định trước số lượng cộng đồng.
Tuy nhiên, thuật toán phân cụm có thể được sử dụng để tìm các cộng đồng, do đó, không đảm bảo rằng mỗi cụm giữ cấu trúc cộng đồng tốt, mỗi cụm nên được kiểm tra cẩn thận.
"người ta không thể áp dụng khám phá cộng đồng một cách tầm thường để giải quyết phân cụm và ngược lại. Mặc dù có những điểm tương đồng, nhưng có những điểm khác biệt quan trọng trong các cách tiếp cận. Khám phá cộng đồng giả định các kết nối thưa thớt, trong khi phân cụm có thể hoạt động với các bộ dữ liệu dày đặc, trong phân cụm chúng ta thường xử lý các thuộc tính với nhiều loại , trong khi khám phá cộng đồng thường liên quan đến một loại thuộc tính duy nhất - các cạnh - thường là nhị phân, trong trường hợp mạng không có trọng số "để biết thêm thông tin, hãy đọc bài viết sau:" Về sự tương đương giữa khám phá cộng đồng và phân cụm "của Riccardo Guidotti và Michele Coscia