Có một câu trả lời toán học rất đơn giản, trực tiếp và chính xác cho câu hỏi ban đầu.
PC đầu tiên là sự kết hợp tuyến tính của các biến ban đầu , , , nhằm tối đa hóa tổng số thống kê khi dự đoán các biến ban đầu là hàm hồi quy của tổ hợp tuyến tính.Y 2 ... Y p R 2 iY1Y2…YpR2i
Chính xác, các hệ số , , , trong PC đầu tiên, , cung cấp cho bạn các giá trị lớn nhất của , trong đó mức tối đa được thực hiện trên tất cả các kết hợp tuyến tính có thể.một 2 ... một p P C 1 = một 1 Y 1 + một 2 Y 2 + ⋯ + một p Y p Σ p i = 1 R 2 i ( Y i | P C 1 )a1a2…apPC1=a1Y1+a2Y2+⋯+apYp∑pi=1R2i(Yi|PC1)
Theo nghĩa này, bạn có thể hiểu PC đầu tiên là một công cụ tối đa hóa "phương sai được giải thích", hay chính xác hơn là một công cụ tối đa hóa "tổng phương sai được giải thích".
Đó là "tối đa hóa" chứ không phải "tối đa hóa", bởi vì bất kỳ hệ số tỷ lệ nào , đối với , sẽ cho cùng một mức tối đa. Một sản phẩm phụ tuyệt vời của kết quả này là hạn chế độ dài đơn vị là không cần thiết, ngoài việc là một thiết bị để đưa ra tối đa hóa "a". c ≠ 0bi=c×aic≠0
Để tham khảo tài liệu gốc và phần mở rộng, xem
Westfall, PH, Arias, AL và Fulton, LV (2017). Dạy các thành phần chính bằng cách sử dụng các mối tương quan, nghiên cứu hành vi đa biến, 52, 648-660.