Tôi rất quan tâm đến phương pháp eigenmaps Laplacian. Hiện tại, tôi đang sử dụng nó để giảm kích thước cho các bộ dữ liệu y tế của mình.
Tuy nhiên, tôi đã gặp phải một vấn đề khi sử dụng phương thức này.
Ví dụ: tôi có một số dữ liệu (tín hiệu phổ), tôi có thể sử dụng PCA (hoặc ICA) để lấy một số PC và IC. Vấn đề là làm thế nào để có được các thành phần giảm kích thước tương tự của dữ liệu gốc?
Theo phương pháp eigenmaps Laplacian, chúng ta cần giải quyết vấn đề eigenvalue tổng quát, đó là
Ở đây y là người bản địa. Nếu tôi vẽ sơ đồ các hàm riêng, ví dụ: top 3 của vectơ y (đặt giải pháp theo 3 giá trị riêng), kết quả không thể hiểu được.
Tuy nhiên, tôi luôn có thể vẽ 3 PC hàng đầu và 3 IC hàng đầu, bằng cách nào đó đại diện cho dữ liệu gốc x.
Tôi giả sử lý do là vì ma trận L được xác định bởi ma trận trọng số (ma trận điều chỉnh W) và dữ liệu x đã được gắn với hạt nhân nhiệt để tạo W, sử dụng hàm số mũ. Câu hỏi của tôi là làm thế nào để lấy các thành phần rút gọn của x (không phải là hàm riêng y của ma trận L)?
Cảm ơn rất nhiều và tôi mong chờ câu trả lời của bạn.
Cảm ơn rất nhiều cho các bạn trả lời.
Tập dữ liệu của tôi bị hạn chế và không dễ để chứng minh vấn đề. Ở đây tôi đã tạo ra một vấn đề đồ chơi để thể hiện những gì tôi muốn nói và những gì tôi muốn hỏi.
Xin vui lòng xem hình ảnh,
Đầu tiên, tôi tạo một số sóng hình sin A, B, C hiển thị theo các đường cong màu đỏ (cột đầu tiên của hình). A, B và C có 1000 mẫu, nói cách khác, được lưu trong các vectơ 1x1000.
Thứ hai, tôi đã trộn các nguồn A, B, C bằng cách sử dụng các kết hợp tuyến tính được tạo ngẫu nhiên, ví dụ: , trong đó r1, r2, r3 là các giá trị ngẫu nhiên. Tín hiệu hỗn hợp M ở trong không gian chiều rất cao, ví dụ: , 1517 được chọn ngẫu nhiên không gian chiều cao. Tôi chỉ hiển thị ba hàng tín hiệu M đầu tiên theo các đường cong màu xanh lá cây (cột thứ hai của hình).M ∈ R 1517 × 1000
Tiếp theo, tôi chạy các bản đồ điện tử PCA, ICA và Laplacian để có kết quả giảm kích thước. Tôi đã chọn sử dụng 3 PC, 3 IC và 3 LE để so sánh công bằng (các đường cong màu xanh hiển thị lần lượt là cột thứ 3, 4 và cột cuối cùng của hình).
Từ kết quả của PCA và ICA (cột thứ 3, thứ 4 của hình), chúng ta có thể thấy rằng chúng ta có thể hiểu kết quả là giảm kích thước, tức là, đối với kết quả ICA, chúng ta có thể khôi phục tín hiệu hỗn hợp bằng (Tôi không chắc liệu chúng tôi cũng có thể nhận được với kết quả PCA hay không nhưng kết quả có vẻ phù hợp với tôi).M = một 1 * P C 1 + một 2 * P C 2 + một 3 * P C 3
Tuy nhiên, xin vui lòng nhìn vào kết quả của LE, tôi hầu như không thể giải thích kết quả (cột cuối cùng của hình). Có vẻ như một cái gì đó 'sai' với các thành phần giảm. Ngoài ra, tôi muốn đề cập rằng cuối cùng, âm mưu của cột cuối cùng là hàm riêng trong công thứcL y = λ D y
Mọi người có nhiều ý tưởng hơn không?
Hình 1 sử dụng 12 lân cận gần nhất và sigma trong nhân gia nhiệt là 0,5:
Hình 2 sử dụng 1000 lân cận gần nhất và sigma trong nhân gia nhiệt là 0,5:
Mã Matlab với gói yêu cầu được tải lên http://www.mediafire.com/?0cqr10fe63jn1d3
Cám ơn rất nhiều.