Làm thế nào để xác định các kết nối có khả năng trong một mạng xã hội?


29

Tôi tò mò trong việc xác định cách tiếp cận để giải quyết thuật toán "bạn bè được đề xuất".

Facebook có một tính năng trong đó nó sẽ giới thiệu các cá nhân cho bạn mà họ nghĩ rằng bạn có thể làm quen được. Những người dùng này thông thường (không bao gồm các trường hợp cạnh trong đó người dùng đặc biệt giới thiệu bạn bè ) có một mạng rất giống với chính họ. Đó là, số lượng bạn bè chung là cao. Tôi giả sử Twitter đi theo một con đường tương tự cho cơ chế "Ai sẽ theo dõi" của họ.

Stephen Doyle (Igy) , một nhân viên của Facebook cho rằng newsfeed có liên quan sử dụng công thức EdgeRank dường như chỉ ra rằng giá trị hơn so với bạn bè như ngoại hình là những bài đăng tương tự. Một người dùng khác đề xuất hệ thống Xếp hạng của Google.

Facebook tuyên bố Tối ưu hóa nguồn cấp tin tức của họ là trong đóuewede

ue = điểm mối quan hệ giữa việc xem người dùng và người tạo cạnh = trọng số cho cạnh này (tạo, nhận xét, thích, thẻ, v.v.) d e = hệ số phân rã thời gian dựa trên khoảng thời gian cạnh được tạo
we
de

Tổng kết các mục này được cho là để đưa ra thứ hạng của một đối tượng mà tôi cho là Igy gợi ý, có nghĩa là một cái gì đó trong định dạng tương tự được sử dụng cho bạn bè được đề xuất.

Vì vậy, tôi đoán rằng đây là cách mà các kết nối cho tất cả các loại được thực hiện nói chung thông qua một hệ thống xếp hạng?


Là một điểm khởi đầu đơn giản, bạn có thể sử dụng hệ thống đề xuất "bạn của bạn bè". Đó là, nếu bạn có nhiều bạn bè là bạn của người X, thì có lẽ bạn nên kết bạn với người X.
Joe

1
có nhiều mô hình đồ thị ngẫu nhiên khác nhau cố gắng nắm bắt cấu trúc của một mạng xã hội thực sự. Tính toán khả năng của một cạnh tiềm năng phụ thuộc vào mô hình bạn sử dụng và thông tin có sẵn.
Kaveh

Câu trả lời:


7

MM2M2


1
fip

Tôi nghĩ rằng mô hình hóa vấn đề với một biểu đồ vừa dễ dàng hơn vừa trực quan hơn.
MMS

11

Những gì bạn đang tìm kiếm là một heuristic. Không có thuật toán nào có thể nói, đưa ra một biểu đồ bạn bè là đầu vào duy nhất, cho dù hai cá nhân không được kết nối trực tiếp là bạn bè hay không; mối quan hệ bạn bè / người quen không được đảm bảo là nhất thời (chúng ta có thể giả định tính đối xứng, nhưng đó thậm chí có thể là một sự căng thẳng trong cuộc sống thực). Do đó, bất kỳ heuristic tốt nào cũng cần phải dựa trên sự hiểu biết về cách mọi người tương tác, thay vì một số hiểu biết toán học về bản chất của đồ thị quan hệ (mặc dù chúng ta sẽ cần định lượng heuristic theo các thuật ngữ này).

Đề xuất bạn bè của bạn bè với xác suất bằng nhau là một heuristic tương đối rẻ nhưng không chính xác. Ví dụ, cha tôi có bạn bè, nhưng tôi sẽ không nói tôi là bạn với bất kỳ ai trong số họ (mặc dù tôi có thể nói tôi là bạn của cha tôi vì mục đích, ví dụ: mạng xã hội). Có một người ở khoảng cách tương đối gần không nhất thiết làm cho họ trở thành một ứng cử viên tuyệt vời.

Nói chung, việc gợi ý những người mà bạn có nhiều kết nối mở rộng cũng có vẻ như là một lựa chọn kém, bởi vì điều này sẽ có xu hướng dẫn đến sự tăng trưởng theo cấp số nhân của những người kéo về sớm (bảy độ tách khỏi trò chơi Kevin Bacon là một ví dụ về điều này).

R

  _____
 /     \
a---c   f
|   | /
b   d---e
| \ |
g   h   i

Nói rằng chúng tôi muốn tìm bạn mới cho a. a's bạn bè hiện tại là b, c, và f. Chúng tôi đánh giá kháng tương đương ròng giữa avà mỗi người trong số d, e, g, h, và i:

pair   resistance
(a,d)   6/7
(a,e)  13/7
(a,g)   7/4
(a,h)   1/1
(a,i)   inf

Theo heuristic này, dlà người bạn ứng cử viên tốt nhất, theo sát bởi h. glà đặt cược tốt nhất tiếp theo, theo sát bởi e. ikhông bao giờ có thể là một người bạn ứng cử viên bởi heuristic này. Cho dù bạn thấy kết quả của heuristic này là đại diện cho các tương tác xã hội thực sự của con người là điều quan trọng. Nói một cách tính toán, điều này sẽ liên quan đến việc tìm một sơ đồ con chứa tất cả các đường dẫn giữa hai cá nhân (hoặc, có lẽ thú vị, một số cắt ngắn được chọn một cách có ý nghĩa của điều này), sau đó đánh giá điện trở tương đương giữa các nút nguồn và nút chìm.

EDIT: Vậy động lực xã hội của tôi cho việc này là gì? Chà, đây có thể là một mô hình sơ bộ về việc khó liên lạc với họ như thế nào và sau đó truyền đạt lượng thông tin quan trọng có thể thông qua các trung gian (bạn bè). Theo thuật ngữ CS (chứ không phải thuật ngữ vật lý), điều này có thể được hiểu là băng thông giữa hai nút trong biểu đồ. Phần mở rộng của hệ thống này sẽ cho phép các loại liên kết khác nhau giữa những người có trọng lượng khác nhau (lực cản, băng thông, v.v.) và tiến hành như trên.


10

Có rất nhiều công việc được thực hiện về vấn đề này khi sự phổ biến của mạng xã hội đã cất cánh. Vấn đề thường được gọi là "Dự đoán liên kết" và các khảo sát rất tốt và toàn diện có thể được tìm thấy ở đâyđây . Các phương thức bao gồm từ rất đơn giản (ví dụ tương tự Jaccard giữa các nút) đến rất phức tạp (ví dụ: xây dựng các mô hình thống kê của quá trình kết nối thế hệ). Nó phụ thuộc rất nhiều vào các tính năng cụ thể mà bạn có trong tập dữ liệu của mình (ví dụ: cấu trúc mạng, thuộc tính nút?, Thuộc tính cạnh, ...), nhưng các khảo sát này sẽ cho bạn ý tưởng tốt để bắt đầu từ đâu.


4

Tuyên bố từ chối trách nhiệm: Tôi đang đoán mò ở đây; Tôi chưa đọc bất kỳ nghiên cứu thể loại nào.

Bạn có thể xem có bao nhiêu kết nối đến các nút chia sẻ tương đối với số lượng kết nối mà một nút có. Đây là một ý tưởng rất ngây thơ (như địa phương), nhưng ở đây đi.

NCNN1N2N2N1

|CN1CN2||CN1|α

α[0,1]

Một ý tưởng khác mang tính toàn cầu hơn: xác định một tập hợp các nút tương tự như nút trong tay và đề xuất các kết nối mà nhiều người trong số họ chia sẻ. Vì vậy, xác định tập hợp các nút tương tự

SN={M:|CNCM|Nα}

và các đề xuất hợp lý của

{S:MSN[SM]|SN|β}

α,β[0,1]

SN

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.