Sự khác biệt giữa các hàm riêng của ma trận ái lực và các hàm riêng của Laplacian trong bối cảnh của cụm phổ là gì?


8

Trong cụm phổ, đó là cách thực hành tiêu chuẩn để giải quyết vấn đề eigenvector

Lv= =λv

Trong đó là đồ thị Laplacian, là hàm riêng liên quan đến eigenvalue .v λLvλ

Câu hỏi của tôi: tại sao phải lấy đồ thị Laplacian? Tôi không thể giải quyết vấn đề eigenvector cho chính đồ thị (ma trận ái lực), giống như anh chàng đã làm trong video này ?

PS: Tôi đã đặt câu hỏi tương tự trong CrossValidated nhưng tôi nghĩ đây là một kênh phù hợp hơn. Hãy tha thứ cho tôi nếu tôi sai.


Liên kết video bị hỏng :(
wcochran

Câu trả lời:


4

Khái niệm này giống nhau nhưng bạn đang bị lẫn lộn bởi loại dữ liệu. Phân cụm phổ như Ng et al. giải thích là về phân cụm dữ liệu tiêu chuẩn trong khi ma trận Laplacian là ma trận dẫn xuất đồ thị được sử dụng trong lý thuyết đồ thị đại số.

Vì vậy, vấn đề là bất cứ khi nào bạn mã hóa sự giống nhau của các đối tượng của mình thành một ma trận, ma trận này có thể được sử dụng để phân cụm phổ.

Nếu bạn có dữ liệu tiêu chuẩn, tức là ma trận tính năng mẫu, bạn có thể tìm thấy độ gần hoặc ái lực hoặc bất cứ điều gì bạn muốn gọi nó là ma trận và áp dụng phân cụm phổ.

Nếu bạn có một biểu đồ, mối quan hệ này sẽ là bất cứ thứ gì như ma trận kề, ma trận khoảng cách hoặc ma trận Laplacialn và giải quyết hàm riêng cho một ma trận như vậy sẽ cho bạn kết quả tương ứng.

Quan điểm về việc sử dụng Laplacian thay vì kề là giữ cho cái gọi là ma trận ái lực tích cực bán xác định (và ma trận Laplacian chuẩn hóa là một lựa chọn tốt hơn vì nó cung cấp cho bạn các giá trị riêng bình thường giữa 0 và 2 và cho thấy cấu trúc của đồ thị tốt hơn nhiều).

Vì vậy, câu chuyện dài ngắn là miễn là bạn có một ma trận chứa ái lực của dữ liệu, bạn có thể sử dụng phân cụm phổ nói chung. Sự khác biệt là về chi tiết (ig tài sản của Laplacian bình thường hóa mà tôi vừa đề cập)


Vâng, tôi nghĩ rằng tôi có một chút bối rối. Nó vẫn chưa rõ ràng với tôi. Nếu tôi có dữ liệu chuẩn (không liên quan đến ái lực), tôi có thể biến nó thành ma trận ái lực A bằng cách lấy khoảng cách cặp giữa các mẫu dữ liệu. Bây giờ nếu tôi thấy A là một biểu đồ, tôi có thể lấy Laplacian và giải quyết cho các hàm riêng và nhận được một giải pháp; nếu tôi không thấy A là một biểu đồ, tôi có thể giải quyết đơn giản cho các hàm riêng của ma trận (PCA) và có được một giải pháp. Có gì khác biệt?
felipeduque

Tôi đọc câu hỏi của bạn một lần nữa. Câu trả lời là các thuộc tính (ví dụ: thuộc tính tôi đã đề cập trong câu trả lời của mình) Ma trận Laplacian cung cấp cho sự phân tách tốt hơn. Tuy nhiên, bạn hoàn toàn có thể duy nhất hàm riêng cho bất kỳ ma trận liên quan tương tự nào và nhận được một số kết quả khác nhau chỉ trong chi tiết. Ví dụ về PCA mà bạn đã đề cập: PCA lấy ma trận hiệp phương sai để nó nắm bắt được phương sai ở mức cao nhưng nhìn chung khái niệm này theo cùng hướng với các kỹ thuật phân rã phổ khác. Tôi sẽ đọc lại câu trả lời của mình ngay khi tôi thấy một số câu "Tối thứ bảy";)
Kasra Manshaei
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.