Khái niệm này giống nhau nhưng bạn đang bị lẫn lộn bởi loại dữ liệu. Phân cụm phổ như Ng et al. giải thích là về phân cụm dữ liệu tiêu chuẩn trong khi ma trận Laplacian là ma trận dẫn xuất đồ thị được sử dụng trong lý thuyết đồ thị đại số.
Vì vậy, vấn đề là bất cứ khi nào bạn mã hóa sự giống nhau của các đối tượng của mình thành một ma trận, ma trận này có thể được sử dụng để phân cụm phổ.
Nếu bạn có dữ liệu tiêu chuẩn, tức là ma trận tính năng mẫu, bạn có thể tìm thấy độ gần hoặc ái lực hoặc bất cứ điều gì bạn muốn gọi nó là ma trận và áp dụng phân cụm phổ.
Nếu bạn có một biểu đồ, mối quan hệ này sẽ là bất cứ thứ gì như ma trận kề, ma trận khoảng cách hoặc ma trận Laplacialn và giải quyết hàm riêng cho một ma trận như vậy sẽ cho bạn kết quả tương ứng.
Quan điểm về việc sử dụng Laplacian thay vì kề là giữ cho cái gọi là ma trận ái lực tích cực bán xác định (và ma trận Laplacian chuẩn hóa là một lựa chọn tốt hơn vì nó cung cấp cho bạn các giá trị riêng bình thường giữa 0 và 2 và cho thấy cấu trúc của đồ thị tốt hơn nhiều).
Vì vậy, câu chuyện dài ngắn là miễn là bạn có một ma trận chứa ái lực của dữ liệu, bạn có thể sử dụng phân cụm phổ nói chung. Sự khác biệt là về chi tiết (ig tài sản của Laplacian bình thường hóa mà tôi vừa đề cập)