Mô hình đồ thị ngẫu nhiên, cho các mạng máy tính thực


19

Tôi quan tâm đến các mô hình đồ thị ngẫu nhiên tương tự như đồ thị của các mạng máy tính thực. Tôi không chắc chắn nếu mô hình nghiên cứu tốt ( n đỉnh, mỗi cạnh có thể được chọn với xác suất p ) có tốt cho việc nghiên cứu các mạng máy tính thực không?G(n,p)np

Những mô hình đồ thị ngẫu nhiên nào hữu ích để hiểu các mạng máy tính gây ra trong thực tế?

Tổng quát hơn, những mô hình đồ thị ngẫu nhiên hữu hạn nào khác (ngoài những mô hình tương đương với mô hình ) đã được nghiên cứu trong tài liệu? (Một câu trả lời lý tưởng sẽ là một con trỏ dẫn đến một cuộc khảo sát cho các mô hình nghiên cứu về đồ thị ngẫu nhiên hữu hạn.)G(n,p)


2
Bạn cần những mô hình như vậy ở đâu - chỉ là để tạo ra một số đầu vào thử nghiệm cho các thuật toán, hay bạn muốn phân tích các mô hình để tìm hiểu điều gì đó về mạng máy tính? Những loại mạng máy tính mà bạn quan tâm; quy mô của bạn (LAN so với internet) là gì? Tại sao bạn cho rằng các mạng máy tính thực được tạo ra bởi một quy trình ngẫu nhiên - đáng ngạc nhiên là các mạng trong thế giới thực được thiết kế bởi một kỹ sư, với rất ít hoạt động tung đồng xu?
Jukka Suomela

@Jukka, tôi đang cố gắng xem liệu tôi có thể áp dụng các kỹ thuật được phát triển cho cho các mô hình ngẫu nhiên đó để có được thông tin về các mạng thực hay không, tôi không muốn cụ thể hơn ngay bây giờ vì nó có thể cung cấp vấn đề tôi đang nghĩ về :). Tôi chủ yếu quan tâm đến lớp IP của Internet. Tôi đã thấy mọi người sử dụng các biểu đồ ngẫu nhiên để phân tích các biểu đồ phát sinh từ các mạng xã hội. Tôi không chắc tại sao các mạng thực này chia sẻ các thuộc tính với các biểu đồ ngẫu nhiên, có thể có một quá trình ngẫu nhiên ẩn đằng sau bề mặt tại nơi làm việc (có vẻ như là một câu hỏi thú vị để hỏi :). G(n,p)
Kaveh

Tôi đoán một phần quan tâm trong việc sử dụng các mô hình ngẫu nhiên là việc phân tích chúng dễ dàng hơn so với phân tích các mạng thực, vì vậy thật hợp lý khi xem xét chúng nếu chúng đủ gần đúng với mô hình thực.
Kaveh

Cảm ơn tất cả mọi người cho câu trả lời tốt đẹp. (Bây giờ tôi phải dành thời gian để đọc những bài báo này. :)
Kaveh

Câu trả lời:


10

Trong vài năm qua, nghiên cứu về đồ thị ngẫu nhiên với các ràng buộc cấu trúc "tự nhiên" đã thu được lực kéo. Ví dụ, người ta có thể xem xét một đồ thị phẳng vẽ UAR từ lớp của tất cả các đồ thị phẳng với đỉnh và nghiên cứu làm thế nào nó cư xử như n . Không giống như các biểu đồ ngẫu nhiên Erdős-Rényi hoặc các mô hình tương tự khác, các cạnh trong các biểu đồ này phụ thuộc rất nhiều, do đó, một trong những động lực giả để nghiên cứu các phân phối như vậy là phân tích các mô hình mạng với sự độc lập rất hạn chế giữa các cạnh.nn

Tuy nhiên, có lẽ hiện tại mục tiêu này có vẻ khá xa vời vì sự độc lập hạn chế khiến việc phân tích các thuộc tính của các biểu đồ như vậy trở nên khó khăn hơn rất nhiều. Trong thực tế, một số câu hỏi cơ bản rất dễ trả lời cho , như phân phối chuỗi độ chỉ mới được giải quyết cho các đồ thị phẳng ngẫu nhiên rất gần đây.G(n,p)

Để tham khảo chính xác, xem các bài viết của Konstantinos Panagiotou và các trích dẫn có trong đó. Để thuận tiện, đây là một mẫu nhỏ của một số giấy tờ có liên quan:

  • Về phân phối mức độ của đồ thị phẳng ngẫu nhiên . Konstantinos Panagiotou và Angelika Steger . Để xuất hiện trong Kỷ yếu của Hội nghị chuyên đề ACM-SIAM hàng năm lần thứ 22 về các thuật toán rời rạc (SODA '11).
  • Về tính chất của phân tích ngẫu nhiên và tam giác . Nicla Bernasconi, Konstantinos Panagiotou và Angelika Steger . Trong Kỷ yếu của Hội nghị chuyên đề ACM-SIAM hàng năm lần thứ 19 về các thuật toán rời rạc (SODA '08), tr. 132-141. [http://www.mpi-inf.mpg.de/~kpanagio/Dissections.pdf]
  • Trên các chuỗi mức độ của đồ thị ngoài cùng ngẫu nhiên và đồ thị song song sê-ri . Nicla Bernasconi, Konstantinos Panagiotou và Angelika Steger . Trong Kỷ yếu của Hội thảo quốc tế lần thứ 12 về Kỹ thuật ngẫu nhiên trong tính toán (RANDOM'08), tr. 303-316. [http://www.mpi-inf.mpg.de/~kpanagio/OPSP.pdf]

1
Một nhận xét bổ sung: dòng nghiên cứu này thực sự đã tồn tại khoảng 15 năm, ít nhất là với một bài báo của Denise, Vasconcellos và Welsh (1996), và một lý do khiến nó "đạt được sức hút" bây giờ là thành công lớn của ứng dụng tổ hợp phân tích và liệt kê tiệm cận ở đây, ví dụ như của Gimenez và Noy (2009).
RJK

10

Khảo sát này, Cấu trúc và chức năng của các mạng phức tạp của Newman, xem xét các kỹ thuật và mô hình cho các mạng phức tạp thực sự bao gồm các khái niệm như hiệu ứng thế giới nhỏ, phân phối độ và mô hình đồ thị ngẫu nhiên. Ngoài ra, cùng một tác giả có một bài báo hay, Đồ thị ngẫu nhiên như mô hình của các mạng , về sự thích ứng của đồ thị ngẫu nhiên để mô hình mạng thực.

Tài liệu tham khảo:

1) Đồ thị ngẫu nhiên như mô hình của các mạng, MEJ Newman, trong Sổ tay đồ thị và mạng, S. Bornholdt và HG Schuster (chủ biên), Wiley-VCH, Berlin (2003)

2) Cấu trúc và chức năng của các mạng phức tạp, MEJ Newman, SIAM xét 45, 167-256 (2003)


1
chỉ tò mò: đây có phải là mạng "xã hội" so với internet không?
Suresh Venkat

Tôi thứ hai: các phương pháp tiếp cận mạng xã hội rất hữu ích, vì phần lớn nghiên cứu về các mạng này ban đầu tập trung vào các thuộc tính "phổ quát" của mạng và bao gồm cấu trúc liên kết thần kinh, lưới điện và mạng lưới đường bộ. Ngoài ra, lưới Barabasi-Albert và Watts-Strogatz, mỗi mạng có các đặc tính mà mạng thực có và Erdos-renyi bỏ qua, được nghiên cứu rất kỹ
Elliot JJ

1
@Suresh, những mạng phức tạp được đề cập trong cả hai tài liệu tham khảo bao gồm các mạng máy tính như Internet và mạng xã hội.
Mohammad Al-Turkistany

8

Mạng máy tính thật ở lớp nào? Internet, ở cấp độ AS (được cho là cấp cao nhất), một mạng thế giới nhỏ với một số nút cực kỳ cao. Khi các lớp tiến gần hơn với các dây thực tế, biểu đồ sẽ liên kết với địa lý nhiều hơn và ít liên kết với tầng xã hội hơn (xã hội là loại từ sai - nó có thực sự là một mạng xã hội khi các thực thể là "bạn bè" là các tập đoàn đa quốc gia?) . Trong trường hợp cực đoan, ethernet cục bộ là một cây logic (có thể) là một sơ đồ con của mô hình vật lý của các kết nối dây và mô hình kết nối dây đó có lẽ không quá nhiều dây hơn một cây.

"Mạng máy tính thực" có rất nhiều hương vị và lớp. Một số trong số họ trông giống như mạng xã hội, một số thì không. Để biết thêm về điều này, tôi vô tình giới thiệu bạn đến chương 2 của luận án của tôi - http://home.manhattan.edu/~peter.boothe/thesis.pdf


Tôi chủ yếu quan tâm đến các mạng vật lý (nói lớp IP). Cảm ơn các liên kết, tôi sẽ kiểm tra nó.
Kaveh

2
Lớp IP không phải là lớp vật lý. MPLS và các công nghệ chuyển mạch khác phá vỡ giả định này. Lớp vật lý là dây. Chúng tôi thậm chí có các liên kết nhiều dây dường như là các bước nhảy ethernet duy nhất! Câu hỏi về "lớp nào" sâu hơn lần kiểm tra đầu tiên có thể gợi ý và đòi hỏi phải suy nghĩ cẩn thận. Tôi đề nghị bạn nghĩ về các thuộc tính mà bạn có thể muốn có một mạng, tìm lớp nơi phân tích cấu trúc liên kết sẽ giúp bạn phân tích thuộc tính đó tốt nhất và hy vọng rằng dữ liệu có sẵn.
Peter Boothe


5

Walter Willinger đã xây dựng một sự nghiệp về việc sử dụng các biểu đồ không có tỷ lệ để mô hình mạng. Có quá nhiều điều để trích dẫn, vì vậy tôi sẽ chỉ cho bạn mục DBLP của anh ấy . Điểm mấu chốt trong các mô hình này là chúng có các thuộc tính tương tự như các mạng "thực" không được G (n, p) nắm bắt.



5

Thay vì miệt mài tìm kiếm, biện minh và phân tích một mô hình cụ thể, bạn có thể muốn sử dụng dữ liệu thực tế nào bạn có (nếu bạn có). Điều đó có nghĩa là xác định một mô hình xác suất chung và huấn luyện các tham số của nó dựa trên dữ liệu của bạn (ví dụ: bằng cách ước tính khả năng tối đa).

Sp1:(S)Sp2:εp1,p2

Rõ ràng, ngữ pháp cụ thể có thể (và nên!) Sử dụng kiến ​​thức miền. Ví dụ, xem xét các ngữ pháp khác nhau được sử dụng để dự đoán cấu trúc thứ cấp RNA trong Dowell, Eddy (2004) cho một hương vị.

Tìm một số chi tiết về kỹ thuật này trong Weinberg, Nebel (2010) . Tuy nhiên, tôi không biết làm thế nào nó có thể được áp dụng cho các biểu đồ chung.

Nếu bạn cần nhiều năng lượng hơn, bạn có thể chuyển sang các công cụ như CFG đa chiều (S) (ví dụ Seki, Kato (2008) ) hoặc SCFG phụ thuộc vào độ dài ( Weinberg, Nebel (2010) ).


1
Điều này thật tuyệt, nhưng không phải bản chất không ngữ cảnh của SCFG buộc người học của bạn bỏ bê cấu trúc toàn cầu nhất định mà các mạng trong tập huấn luyện của bạn có thể có?
Artem Kaznatcheev

Vâng, phải, các tính năng phi ngữ cảnh bị mất. Nhưng lưu ý rằng các thuộc tính như độ nút (trung bình) có thể được ghi lại. Để biết thêm, xem chỉnh sửa của tôi.
Raphael

Cảm ơn! Tôi sẽ xem xét kỹ hơn. MDP ẩn không thể nắm bắt các thuộc tính như mức độ trung bình? Đó dường như là thứ mà một ngôn ngữ thông thường có thể nắm bắt được, hay tôi bối rối? (Ngoài ra, điểm nhỏ: liên kết Weinberg, Nebel có một ký tự theo dõi giết chết liên kết, rõ ràng liên kết bạn dự định là gì, nhưng nếu bạn chỉnh sửa nhiều hơn thì có thể sửa chữa).
Artem Kaznatcheev

Chắc chắn, tôi chỉ muốn chỉ ra rằng bạn có thể bao gồm một số đặc điểm toàn cầu bằng cách sử dụng mô hình đó. REG cũng có thể bao gồm một số, nhưng sẽ thất bại trong việc mô hình hóa các cấu trúc không thường xuyên. (cảm ơn, đã sửa)
Raphael

3

G(n,p)G(n,m)

Như bạn có thể biết, dường như có một sự khác biệt giữa biểu đồ kết nối cho World Wide Web và trái ngược với biểu đồ kết nối cho cơ sở hạ tầng Internet. Tôi chắc chắn không tự nhận mình là một chuyên gia, nhưng tôi đã thấy bài viết của Li, Alderson, Tanaka, Doyle và Willinger "Hướng tới một lý thuyết về đồ thị không có tỷ lệ: Định nghĩa, tính chất và hàm ý" , người giới thiệu một số liệu 'để đo' tỷ lệ không đổi màu 'của biểu đồ (với định nghĩa về biểu đồ không có tỷ lệ vẫn đang được tranh luận theo như tôi biết) cho rằng có một mô hình biểu đồ tạo ra các biểu đồ tương tự như kết nối internet tại bộ định tuyến cấp độ.

Dưới đây là một vài mô hình tổng quát có thể được quan tâm:

Bài viết của Berger, Borgs, Chayes, D'Souza và Kleinberg " Tài liệu đính kèm ưu tiên cạnh tranh"

Dung sai tối ưu hóa cao của Carlson và Doyle : Một cơ chế cho các quy luật quyền lực trong các hệ thống được thiết kế

Điểm quan trọng của Molloy và Sậy đối với đồ thị ngẫu nhiên với trình tự mức độ nhất định giới thiệu "Mô hình cấu hình bị xóa"

Newman Clustering và đính kèm ưu đãi trong các mạng đang phát triển (đã được đề cập)

Người ta cũng có thể tạo ra một phân phối độ rõ ràng và tạo một biểu đồ theo cách này, nhưng đối với tôi không rõ mô hình này biểu đồ internet ở mức độ bộ định tuyến như thế nào.

Tất nhiên, có nhiều tài liệu hơn về chủ đề này và tôi chỉ đưa ra một vài trong số (những gì tôi cho là) ​​những điểm nổi bật.

G(n,p)G(n,m)) không hoạt động chính xác bởi vì mức độ quy mô ngẫu nhiên hoặc mức độ pháp luật phân phối đồ thị ngẫu nhiên phân kỳ giây thứ hai trong phân phối độ. Tôi không yêu cầu biết đủ về đối tượng để đưa ra tuyên bố chính xác về bằng chứng "nhất", nhưng từ những gì tôi đã thấy, một trong vài dòng chứng minh đầu tiên cho các thuộc tính trên biểu đồ ngẫu nhiên Erdos-Renyi giả định rõ ràng là hữu hạn khoảnh khắc thứ hai trong phân phối độ. Theo quan điểm của tôi, điều này có ý nghĩa như một khoảnh khắc thứ hai hữu hạn làm cho đồ thị Erdos-Renyi giống như cây địa phương hơn nhiều (xem Thông tin, vật lý và tính toán của Mertens và Montanari) có hiệu quả mang lại sự độc lập cho các thuộc tính / đường dẫn / cấu trúc. Do các biểu đồ ngẫu nhiên phân phối mức độ pháp luật có thời điểm thứ hai phân kỳ, cấu trúc giống như cây cục bộ này bị phá hủy (và do đó đòi hỏi các kỹ thuật chứng minh khác nhau?). Tôi sẽ rất vui khi trực giác này bị vô hiệu nếu ai đó có nhiều kiến ​​thức hoặc hiểu biết sâu sắc hơn cho thấy tại sao điều này không phải như vậy.

Mong rằng sẽ giúp.


3

Mặc dù đó là một chủ đề cũ tôi đang trả lời vì có nhiều người vẫn truy cập các bài viết như vậy. Tôi có động lực từ một bình luận trong một trả lời khác.

Mô hình Barabasi-Albert và các mô hình khác tạo ra đồ thị không có tỷ lệ đã được đề xuất để mô hình hóa Internet ở cấp độ bộ định tuyến và ở cấp hệ thống tự trị. Mặc dù ban đầu những mô hình như vậy được coi là chính xác nhưng hóa ra chúng ta không có một hình ảnh hoàn chỉnh về cấu trúc liên kết Internet do những khó khăn trong việc khám phá tất cả các liên kết. Mặc dù nó được cho là đuôi nặng nhưng nó đang tiến hành khá nhiều.

Để bạn tham khảo, bạn có thể đọc: RG Clegg, C Di Cairano-Gilfedder, S Zhou, Một cái nhìn quan trọng về mô hình luật quyền lực của Internet


2

Có một số cuốn sách về các biểu đồ ngẫu nhiên, như Sách của Bollobás và có một số mô hình biểu đồ ngẫu nhiên như liên kết wikipedia của thế giới nhỏ hoặc liên kết wikipedia của tệp đính kèm ưu tiên , để mô hình các mạng có khoảng cách nhỏ giữa các máy tính hoặc các phân phối độ theo luật công suất , tương ứng.

Tôi nghĩ rằng không có cách nào dễ dàng để mô hình hóa một mạng máy tính thực sự, nhưng tôi khá chắc chắn rằng G (n, p) sẽ không mô hình hóa nó rất tốt. Trừ khi bạn đang làm việc với một mạng được tổ chức rất cụ thể.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.