Nhúng tuyến tính cục bộ (LLE) loại bỏ sự cần thiết phải ước tính khoảng cách giữa các đối tượng ở xa và phục hồi cấu trúc phi tuyến tính toàn cầu bằng cách khớp tuyến tính cục bộ. LLE là lợi thế vì nó không liên quan đến các tham số như tỷ lệ học tập hoặc tiêu chí hội tụ. LLE cũng có quy mô tốt với chiều hướng nội tại của Y . Hàm mục tiêu cho LLE là
ζ(Y)=(Y−WY)2=Y⊤(I−W)⊤(I−W)Y
Ma trận trọng sốW phần tửwij cho các đối tượngi vàj được đặt thành 0 nếu j không phải là hàng xóm gần nhất của i , nếu không, trọng số của K- Hàng xóm gần nhất của đối tượng i được xác định thông qua một bình phương tối thiểu phù hợp với
trong đó biến phụ thuộc là mộtU = G β vectơ của những người, GjiiU=Gβ
UK×1G là ma trận Gram cho tất cả các lân cận gần nhất của đối tượng và là một vectơ trọng số tuân theo các ràng buộc tổng hợp. Đặt là một ma trận khoảng cách nửa đối xứng cho tất cả các cặp lân cận K gần nhất của đối tượng . Có thể chỉ ra rằng bằng với ma trận khoảng cách trung tâm gấp đôi với các phần tử
K×KTôiβK× 1DK× KpxTôiGττl m= - 12( d2l m- 1KΣtôid2l m- 1KΣmd2l m+∑l∑md2lm).
KβK×1=(τ⊤τ)K×K-1τ⊤UK×1,βiWi
Các hệ số hồi quy được xác định bằng số bằng cách sử dụng
và được kiểm tra để xác nhận họ tổng hợp lại. Các giá trị của được nhúng vào hàng của tại các vị trí cột khác nhau tương ứng với hàng xóm K gần nhất của đối tượngKβK×1=(τ⊤τ)K×K−1τ⊤UK×1,
βiWi, cũng như các yếu tố chuyển vị. Điều này được lặp lại cho mỗi đối tượng thứ trong bộ dữ liệu. Nó đảm bảo rằng nếu số lượng hàng xóm gần nhất quá thấp, thì có thể thưa thớt khiến việc phân tích sinh học trở nên khó khăn. Nó đã được quan sát thấy rằng hàng xóm gần nhất dẫn đến ma trận không chứa bệnh lý trong quá trình phân tích sinh học. Hàm mục tiêu được giảm thiểu bằng cách tìm các giá trị riêng khác không nhỏ nhất của
Dạng rút gọn của được biểu thị bằngiKWK=9W(I−W)⊤(I−W)E=ΛDE.
XY=E trong đó có kích thước dựa trên hai giá trị riêng thấp nhất của . En×2Λ