PCA là một trong nhiều cách để phân tích cấu trúc của ma trận tương quan đã cho. Bằng cách xây dựng, trục chính đầu tiên là một trong đó tối đa hóa phương sai (phản ánh bởi eigenvalue của nó) khi dữ liệu được chiếu lên một dòng (viết tắt của một hướng đi trong không gian ba chiều, giả sử bạn có p biến) và một trong những thứ hai là trực giao với nó, và vẫn tối đa hóa phương sai còn lại. Đây là lý do tại sao sử dụng hai trục đầu tiên sẽ mang lại xấp xỉ tốt hơn không gian biến ban đầu (giả sử, ma trận X có độ mờ n × pppXn×p ) khi chiếu lên mặt phẳng.
Các thành phần chính chỉ là sự kết hợp tuyến tính của các biến ban đầu. Do đó, việc vẽ các điểm yếu tố riêng lẻ (được định nghĩa là , trong đó u là vectơ tải của bất kỳ thành phần chính nào) có thể giúp làm nổi bật các nhóm của các cá nhân đồng nhất, ví dụ, hoặc để giải thích điểm tổng thể của một người khi xem xét tất cả các biến cùng một lúc . Nói cách khác, đây là một cách để tóm tắt vị trí của một người liên quan đến giá trị của anh ta trên pXuupcác biến, hoặc một sự kết hợp của chúng. Trong trường hợp của bạn, Hình 13.3 trong HSAUR cho thấy Joyner-Kersee (Jy-K) có điểm số cao (âm) trên trục thứ 1, cho thấy anh ta thực hiện tổng thể khá tốt trên tất cả các sự kiện. Cùng một dòng lý luận áp dụng cho việc giải thích trục thứ hai. Tôi có một cái nhìn rất ngắn về con số này vì vậy tôi sẽ không đi sâu vào chi tiết và cách giải thích của tôi chắc chắn là hời hợt. Tôi giả định rằng bạn sẽ tìm thấy thêm thông tin trong sách giáo khoa HSAUR. Ở đây cần lưu ý rằng cả hai biến và cá nhân được hiển thị trên cùng một sơ đồ (điều này được gọi là biplotr(x1,x2)=cos2(x1,x2)
Tuy nhiên, tôi nghĩ rằng bạn nên bắt đầu đọc một số cuốn sách giới thiệu về phân tích đa biến để hiểu sâu hơn về các phương pháp dựa trên PCA. Ví dụ, BS Everitt đã viết một cuốn sách giáo khoa xuất sắc về chủ đề này, Phân tích R và S-Plus ® để phân tích đa biến và bạn có thể kiểm tra trang web đồng hành để minh họa. Có các gói R tuyệt vời khác để phân tích dữ liệu đa biến được áp dụng, như ade4 và FactoMineR .