Tổng phương sai của tất cả các thành phần PLS thường nhỏ hơn 100%.
Có nhiều biến thể của bình phương nhỏ nhất một phần (PLS). Những gì bạn đã sử dụng ở đây, là hồi quy PLS của một biến trả lời đơn biến vào một số biến ; thuật toán này theo truyền thống được gọi là PLS1 (trái ngược với các biến thể khác, xem Rosipal & Kramer, 2006, Tổng quan và những tiến bộ gần đây trong bình phương tối thiểu để biết tổng quan ngắn gọn). PLS1 sau đó đã được hiển thị tương đương với một công thức thanh lịch hơn được gọi là SIMPLS (xem tài liệu tham khảo về Jong 1988 được trả tiền trong Rosipal & Kramer). Chế độ xem được cung cấp bởi SIMPLS giúp hiểu những gì đang diễn ra trong PLS1.yX
Nó chỉ ra rằng những gì PLS1 làm, là tìm một chuỗi các phép chiếu tuyến tính , sao cho:ti=Xwi
- Hiệp phương sai giữa và là tối đa;yti
- Tất cả các vectơ trọng lượng có chiều dài đơn vị, ;∥wi∥=1
- Bất kỳ hai thành phần PLS nào (còn gọi là vectơ điểm) và đều không tương thích.titj
Lưu ý rằng vectơ trọng lượng không phải (và không) trực giao.
Điều này có nghĩa là nếu bao gồm biến và bạn đã tìm thấy thành phần PLS, thì bạn đã tìm thấy một cơ sở không trực giao với các phép chiếu không tương quan trên các vectơ cơ sở. Một mặt toán học có thể chứng minh rằng trong một tình huống như vậy tổng của chênh lệch của tất cả các dự báo sẽ ít thì tổng phương sai của . Chúng sẽ bằng nhau nếu các vectơ trọng lượng là trực giao (ví dụ như trong PCA), nhưng trong PLS thì không phải như vậy.Xk=1010X
Tôi không biết về bất kỳ sách giáo khoa hay bài báo nào thảo luận rõ ràng về vấn đề này, nhưng trước đó tôi đã giải thích nó trong bối cảnh phân tích phân biệt tuyến tính (LDA) cũng đưa ra một số dự đoán không tương quan về các vectơ trọng lượng đơn vị không trực giao, xem tại đây : Tỷ lệ phương sai được giải thích trong PCA và LDA .