Trực giác đằng sau giá trị bản địa của ma trận kề


10

Tôi hiện đang làm việc để hiểu việc sử dụng ràng buộc Cheeger và bất bình đẳng của Cheeger, và việc sử dụng chúng để phân vùng quang phổ, độ dẫn, mở rộng, v.v., nhưng tôi vẫn đấu tranh để bắt đầu một trực giác về giá trị bản địa thứ hai của ma trận kề.
Thông thường, trong lý thuyết đồ thị, hầu hết các khái niệm chúng ta bắt gặp khá đơn giản để giao tiếp, nhưng trong trường hợp này, tôi thậm chí không thể đưa ra loại biểu đồ nào có giá trị riêng thứ hai rất thấp hoặc rất cao.
Tôi đã đọc những câu hỏi tương tự được hỏi ở đây và trên mạng SE, nhưng chúng thường đề cập đến giá trị bản địa trong các lĩnh vực khác nhau ( phân tích đa biến , ma trận khoảng cách Euclidian , ma trận tương quan ...).
Nhưng không có gì về phân vùng quang phổ và lý thuyết đồ thị.

Ai đó có thể thử và chia sẻ trực giác / kinh nghiệm của mình về giá trị riêng thứ hai này trong trường hợp đồ thị và ma trận kề không?


Bạn có quen thuộc với mối liên hệ giữa phổ của ma trận kề và sự hội tụ của các bước ngẫu nhiên trên biểu đồ không?
Yuval Filmus

@YuvalFilmus Hoàn toàn không, mặc dù đã thực sự quen thuộc với các bước đi ngẫu nhiên và bằng cách nào đó quen thuộc với phổ của ma trận kề. Vì vậy, tôi quan tâm đến quan điểm của bạn thực sự :)
m.raynal

Câu trả lời:


6

Giá trị riêng thứ hai (tính theo độ lớn) kiểm soát tốc độ hội tụ của bước đi ngẫu nhiên trên biểu đồ. Điều này được giải thích trong nhiều ghi chú bài giảng, ví dụ như ghi chú bài giảng của Luca Trevisan . Nói một cách đơn giản, khoảng cách L2 đến tính đồng nhất sau các bước có thể được giới hạn bởi .tλ2t

Một nơi khác mà eigenvalue thứ hai xuất hiện là vấn đề clique trồng . Điểm khởi đầu là quan sát rằng một đồ thị ngẫu nhiên chứa một cụm có kích thước , nhưng thuật toán tham lam chỉ tìm thấy một cụm có kích thước và không có thuật toán nào hiệu quả hơn. (Thuật toán tham lam chỉ chọn một nút ngẫu nhiên, loại bỏ tất cả những người không phải là hàng xóm và lặp lại.)G(n,1/2)2log2nlog2n

Điều này cho thấy việc trồng một cụm lớn trên đỉnh . Câu hỏi là: các cụm nên lớn như thế nào, để chúng ta có thể tìm thấy nó một cách hiệu quả. Nếu chúng ta trồng một cụm có kích thước , thì chúng ta có thể xác định các đỉnh của cụm chỉ bằng mức độ của chúng; nhưng phương pháp này chỉ hoạt động đối với các nhóm có kích thước . Chúng ta có thể cải thiện điều này bằng cách sử dụng các kỹ thuật quang phổ: nếu chúng ta trồng một cụm có kích thước , thì trình xác định thứ hai mã hóa cụm, như Alon, Krivelevich và Sudakov đã trình bày trong một bài báo cổ điển.G(n,1/2)CnlognΩ(nlogn)Cn

Tổng quát hơn, một vài hàm riêng đầu tiên rất hữu ích để phân vùng đồ thị thành một số lượng nhỏ các cụm. Xem ví dụ Chương 3 của các bài giảng của Luca Trevisan , trong đó mô tả sự bất bình đẳng Cheeger bậc cao.


5

(Tuyên bố miễn trừ trách nhiệm: Câu trả lời này là về giá trị riêng của đồ thị nói chung, không phải là giá trị riêng thứ hai nói riêng. Tôi hy vọng nó vẫn hữu ích.)

Một cách suy nghĩ thú vị về giá trị riêng của đồ thị là bằng cách lấy không gian vectơ trong đóvà xác định mỗi vectơ có hàm (nghĩa là ghi nhãn đỉnh). Do đó, một hàm riêng của ma trận kề, là một phần tử của sao cho có (nghĩa là một giá trị riêng) với , là ma trận kề của . Lưu ý rằng là vectơ được liên kết với bản đồ sẽ gửi mọi đỉnh tớiG=(V,E)Rnn=|V|f:VRfRnλRAf=λfAGAfvVuN(v)f(u), là tập hợp các lân cận (nghĩa là các đỉnh liền kề) . Do đó, trong cài đặt này, thuộc tính eigenvector của tương ứng với thuộc tính tổng các giá trị hàm (dưới ) của các lân cận của một đỉnh mang lại kết quả tương tự như nhân giá trị hàm của đỉnh với hằng số .N(v)uff λfλ


Cảm ơn rất nhiều, tôi chưa bao giờ 'thấy' rằng trình xác định nhân với \ lambda có giá trị tổng của các giá trị hàm của hàng xóm (ngay cả khi nó đi thẳng từ định nghĩa).
m.raynal

1
Tôi cũng vậy :) Tôi đã tìm thấy nó một cách tình cờ trong một giáo trình về giá trị bản địa của đồ thị.
dkaeae

5

Tôi nghĩ rằng đối với hầu hết mọi thứ, sẽ hiệu quả hơn khi nhìn vào Laplacian của đồ thị , có liên quan chặt chẽ với ma trận kề. Tại đây, bạn có thể sử dụng nó để liên kết giá trị riêng thứ hai với thuộc tính "cục bộ so với toàn cầu" của biểu đồ.G

Để đơn giản, chúng ta hãy giả sử rằng là -regular. Khi đó Laplacian được chuẩn hóa của là , trong đó là danh tính và là ma trận kề. Điều thú vị về Laplacian là, viết các vectơ là các hàm như @dkaeae và sử dụng cho sản phẩm bên trong thông thường, chúng ta có biểu thức rất hay này đối với dạng bậc hai được đưa ra bởi : GdGL=I1dAIn×nAf:VR,L

f,Lf=1d(u,v)E(f(u)f(v))2.

Giá trị riêng lớn nhất của là và tương ứng với giá trị riêng nhỏ nhất của , là ; giá trị riêng lớn thứ hai của tương ứng với giá trị riêng nhỏ thứ hai của , là . Theo nguyên tắc tối thiểu , chúng ta cóAdL0λ2AL1λ2d

1λ2d=min{f,Lff,f:vVf(v)=0,f0}.

Lưu ý rằng không thay đổi khi chúng ta dịch chuyển theo cùng một hằng số cho mọi đỉnh. Vì vậy, tương tự, bạn có thể xác định, đối với mọi , hàm "căn giữa" bởi và viếtf,Lfff:VRf0f0(u)=f(u)1nvVf(v)

1λ2d=min{f,Lff0,f0:f not constant}.

Bây giờ một chút tính toán cho thấy , và thay thế ở trên và chia tử số và mẫu số cho , chúng ta cóf0,f0=1n{u,v}(V2)(f(u)f(v))2n2

1λ2d=min{2nd(u,v)E(f(u)f(v))22n2{u,v}(V2)(f(u)f(v))2:f not constant}.

Điều này có nghĩa là, nếu chúng ta đặt mọi đỉnh của trên đường thẳng thực tại điểm , thì khoảng cách trung bình giữa hai đỉnh ngẫu nhiên độc lập trong biểu đồ (mẫu số) nhiều nhất là nhân khoảng cách trung bình giữa các điểm cuối của một cạnh ngẫu nhiên trong biểu đồ (tử số). Vì vậy, theo nghĩa này, một khoảng cách quang phổ lớn có nghĩa là những gì xảy ra trên một cạnh ngẫu nhiên của (hành vi cục bộ) là một yếu tố dự báo tốt cho những gì xảy ra trên một cặp đỉnh ngẫu nhiên (hành vi toàn cầu).uGf(u)ddλ2G

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.