Phân phối và phương sai của số lượng tam giác trong đồ thị ngẫu nhiên


10

Xét một đồ thị ngẫu nhiên Erdos-Renyi . Tập hợp đỉnh được dán nhãn bởi . Tập hợp các cạnh được xây dựng theo một quy trình ngẫu nhiên.n V V = { 1 , 2 , Hoài , n } EG=(V(n),E(p))nVV={1,2,,n}E

Đặt là xác suất , sau đó mỗi cặp không có thứ tự của các đỉnh ( ) xảy ra như một cạnh trong với xác suất , độc lập với các cặp khác.0 < p < 1 { i , j } i j E pp0<p<1{i,j}ijEp

Một tam giác trong là một bộ ba không có thứ tự của các đỉnh riêng biệt, sao cho , và là các cạnh trong .{ i , j , k } { i , j } { j , k } { k , i } GG{i,j,k}{i,j}{j,k}{k,i}G

Số lượng tam giác tối đa có thể là (n3) . Xác định các biến ngẫu nhiên X là số quan sát các hình tam giác trong đồ thị G .

Xác suất mà ba liên kết đồng thời có mặt là p3 . Do đó, giá trị mong đợi của X được cho bởi E(X)=(n3)p3 . Ngây thơ, người ta có thể đoán rằng phương sai được đưa ra bởi E(X2)=(n3)p3(1p3) , nhưng đây không phải là trường hợp.

Mathicala sau đây mô phỏng vấn đề:

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

Phương sai của X gì?

Câu trả lời:


4

Đặt iff tạo thành một tam giác. Sau đó và mỗi . Đây là những gì bạn đã sử dụng để tính giá trị mong đợi.Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

Đối với phương sai, vấn đề là không độc lập. Thật vậy, hãy viết Chúng ta cần tính , đó là xác suất mà cả hai tam giác đều có mặt. Có một số trường hợp:Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • Nếu (cùng 3 đỉnh) thì . Sẽ có các điều khoản như vậy trong tổng số kép.{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • Nếu các bộ và có chính xác 2 phần tử, thì chúng ta cần có 5 cạnh để có hai hình tam giác, sao cho . sẽ có các điều khoản như vậy trong tổng số.{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • Nếu các bộ và có 1 phần tử chung, thì chúng ta cần có 6 cạnh, để . Sẽ có các điều khoản như vậy trong tổng số.{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • Nếu các bộ và có 0 phần tử chung, thì chúng ta cần có 6 cạnh, để . Sẽ có các điều khoản như vậy trong tổng số.{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

Để xác minh rằng chúng tôi đã bao gồm tất cả các trường hợp, lưu ý rằng tổng cộng cộng với .(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

Ghi nhớ để trừ đi bình phương của giá trị trung bình dự kiến, kết hợp tất cả lại với nhau:

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

Sử dụng cùng các giá trị số như ví dụ của bạn, mã R sau đây sẽ tính toán độ lệch chuẩn, gần bằng với giá trị của 262 từ mô phỏng của bạn.

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

Mathicala sau đây cũng tính toán độ lệch chuẩn, cho kết quả tương tự.

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795

2
Thực tế khá đơn giản. Làm tốt! Tôi đã cập nhật câu trả lời của bạn một chút, đơn giản hóa các biểu thức và thêm Mathematica mã. Tôi cũng đã chạy mô phỏng của mình 10 nghìn lần và đạt được tiêu chuẩn 295,37, rất gần với giá trị mong đợi.
LBogaardt

1
Cảm ơn đã chỉnh sửa. Tôi rất vui vì mô phỏng với số lần lặp 10k xác nhận câu trả lời!
Robin Ryder

Tôi tìm thấy tài liệu tham khảo ban đầu, cho các đồ thị có hướng: Holland (1970). Phương pháp phát hiện cấu trúc trong dữ liệu xã hội học.
LBogaardt

0

Tôi cung cấp một cách tiếp cận hơi khác về việc tạo ra .X2

Với sự phân biệt trường hợp tương tự như Robin Ryder đã làm:

  • Nếu tức là 3 đỉnh giống nhau, do đó chúng ta phải chọn 3 đỉnh trong số n có thể . Chúng ta phải có 3 cạnh hiện tại . Kết hợp:{i,j,k}={i,j,k}(n3)p3(n3)p3

  • Nếu và có hai đỉnh chung, có nghĩa là mà và ngược lại (mỗi tam giác có một đỉnh không phải là một phần của tam giác khác). Wlog hãy tưởng tượng và là các đỉnh khác nhau được đề cập và = , = . Để đạt được = , = , chúng ta phải chọn hai đỉnh giống nhau trong số n có thể . Dành cho{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kkchúng ta phải chọn thêm hai trong số các đỉnh còn lại. Cái thứ nhất: và cái thứ hai: . Vì cạnh và là như nhau, nên chúng ta phải có 5 cạnh hiện tại . Kết hợp:(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • Nếu và chỉ có một đỉnh chung thì 4 là không khớp nhau. Hãy tưởng tượng, wlog, rằng = . Điều đó có nghĩa là, trong số n đỉnh có thể, chúng ta phải chọn 1 . Đối với tam giác chúng tôi chọn 2 đỉnh trong số còn lại . Đối với tam giác chúng tôi chọn 2 trong số còn lại , điều này là do giả định rằng và . Bởi vì chúng ta chỉ có một đỉnh chung, chúng ta phải có 6 cạnh{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6 . Kết hợp:n(n12)(n32)p6

  • Đối với trường hợp cuối cùng: Nếu và không có đỉnh chung, thì 2 tam giác là không khớp nhau. Chúng tôi chọn tam giác đầu tiên, 3 đỉnh trong số n có thể . Và tam giác thứ hai, 3 đỉnh trong số còn lại . Các tam giác là không khớp nhau, tức là chúng không có cạnh và đỉnh, do đó phải có 6 cạnh . Kết hợp:{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

Như trong cách tiếp cận của Robin Ryder, chúng tôi cũng có thể xác minh rằng:

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2 giữ.

Điều này dẫn đến:

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.