Đây là ba phương pháp khác nhau và không có phương pháp nào có thể được xem là trường hợp đặc biệt của phương pháp khác.
Chính thức, nếu và Y là bộ dữ liệu dự đoán trung tâm ( n × p ) và phản hồi ( n × q ) và nếu chúng ta tìm cặp trục đầu tiên, w ∈ R p cho X và v ∈ R q cho Y , thì các phương thức này tối đa hóa số lượng sau:XYn×pn×qw∈RpXv∈RqY
PCA:RRR:PLS:CCA:Var(Xw)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)Var(Xw)⋅Corr2(Xw,Yv)⋅Var(Yv)=Cov2(Xw,Yv)Var(Xw)⋅Corr2(Xw,Yv)
(Tôi đã thêm phân tích tương quan chính tắc (CCA) vào danh sách này.)
Tôi nghi ngờ rằng sự nhầm lẫn có thể là do trong SAS cả ba phương thức dường như được thực hiện thông qua cùng một chức năng PROC PLS
với các tham số khác nhau. Vì vậy, có vẻ như cả ba phương pháp đều là trường hợp đặc biệt của PLS bởi vì đó là cách chức năng của SAS được đặt tên. Tuy nhiên, đây chỉ là một cách đặt tên không may. Trong thực tế, PLS, RRR và PCR là ba phương pháp khác nhau được thực hiện trong SAS theo một chức năng mà vì một lý do nào đó được gọi PLS
.
Cả hai hướng dẫn mà bạn liên kết đến thực sự rất rõ ràng về điều đó. Trang 6 của hướng dẫn trình bày nêu các mục tiêu của cả ba phương pháp và không nói PLS "trở thành" RRR hoặc PCR, trái với những gì bạn đã tuyên bố trong câu hỏi của mình. Tương tự, tài liệu của SAS giải thích rằng ba phương pháp là khác nhau, đưa ra các công thức và trực giác:
Hồi quy thành phần rincipal chọn các yếu tố giải thích càng nhiều biến đổi dự báo càng tốt, hồi quy xếp hạng giảm chọn các yếu tố giải thích càng nhiều biến đổi phản ứng càng tốt và bình phương tối thiểu một phần cân bằng hai mục tiêu, tìm kiếm các yếu tố giải thích cả biến đổi phản ứng và biến đổi dự báo .
Thậm chí còn có một hình trong tài liệu của SAS cho thấy một ví dụ đồ chơi đẹp trong đó ba phương pháp đưa ra các giải pháp khác nhau. Trong ví dụ đồ chơi này có hai yếu tố dự đoán và x 2 và một biến trả lời yx1x2y . Hướng trong đó là tương quan nhất với y sẽ xảy ra là trực giao với hướng sai tối đa trong X . Do đó PC1 trực giao với trục RRR đầu tiên và trục PLS nằm ở giữa.XyX
Người ta có thể thêm một hình phạt sườn núi cho chức năng bị mất RRR có được hồi quy thứ hạng giảm dần, hoặc RRRR. Điều này sẽ kéo trục hồi quy theo hướng PC1, hơi giống với những gì PLS đang làm. Tuy nhiên, hàm chi phí cho RRRR không thể được viết dưới dạng PLS, vì vậy chúng vẫn khác nhau.
y