Các tải ( không nên nhầm lẫn với các hàm riêng) có các thuộc tính sau:
- Tổng các hình vuông của chúng trong mỗi thành phần là giá trị riêng (phương sai của các thành phần).
- Tải là các hệ số trong tổ hợp tuyến tính dự đoán một biến bởi các thành phần (được tiêu chuẩn hóa).
Bạn đã trích xuất 2 PC đầu tiên trong số 4. Ma trận tải và giá trị riêng:Một
A (loadings)
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Eigenvalues:
1.0000000000 1.0000000000
Trong trường hợp này, cả hai giá trị riêng đều bằng nhau. Đây là một trường hợp hiếm hoi trong thế giới thực, nó nói rằng PC1 và PC2 có "sức mạnh" giải thích ngang nhau.
Giả sử bạn cũng đã tính các giá trị thành phần, Nx2
ma trận và bạn đã chuẩn hóa z (mean = 0, st. Dev. = 1) chúng trong mỗi cột. Sau đó (như điểm 2 nêu trên nói), X = C A ' . Nhưng, bởi vì bạn chỉ còn lại 2 máy tính ra khỏi 4 (bạn thiếu 2 cột hơn trong A ) các giá trị dữ liệu phục hồi XCX^= C A'MộtX^ là không chính xác, - có một lỗi (nếu giá trị riêng 3, 4 không phải là zero).
ĐỒNG Ý. Các hệ số để dự đoán các thành phần theo các biến là gì? Rõ ràng, nếu đầy , những thứ này sẽ là B = (Một4x4
. Với ma trận tải không vuông, chúng tôi có thể tính toán chúng như B = Một ⋅ d i một g ( e i g đ n v một l u đ s ) - 1 = ( A + ) 'B = ( A- 1)'B = A ⋅ d i a g ( e i g e n v a l u e s )- 1= ( A+)' , nơidiag(eigenvalues)
là ma trận đường chéo vuông với các giá trị riêng trên đường chéo của nó và +
siêu ký tự biểu thị giả ngẫu nhiên. Trong trường hợp của bạn:
diag(eigenvalues):
1 0
0 1
B (coefficients to predict components by original variables):
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Vì vậy, nếu là ma trận của các biến trung tâm ban đầu (hoặc các biến được tiêu chuẩn hóa, nếu bạn đang thực hiện PCA dựa trên các mối tương quan chứ không phải hiệp phương sai), thì C = X B ; C là điểm thành phần chính được chuẩn hóa. Mà trong ví dụ của bạn là:XNx4
C = X BC
PC1 = 0,5 * X1 + 0,5 * X2 + 0,5 * X3 + 0,5 * X4 ~ (X1 + X2 + X3 + X4) / 4
"thành phần đầu tiên tỷ lệ thuận với điểm trung bình"
PC2 = 0,5 * X1 + 0,5 * X2 - 0,5 * X3 - 0,5 * X4 = (0,5 * X1 + 0,5 * X2) - (0,5 * X3 + 0,5 * X4)
"thành phần thứ hai đo lường sự khác biệt giữa cặp điểm số thứ nhất và cặp điểm số thứ hai"
Trong ví dụ này có vẻ như , nhưng trong trường hợp chung thì chúng khác nhau.B = A
Lưu ý : Công thức trên cho các hệ số để tính điểm thành phần, B = A ⋅ d i a g ( e i g e n v a l u e s )- 1B = R- 1MộtRlà ma trận hiệp phương sai (hoặc tương quan) của các biến. Công thức sau xuất phát trực tiếp từ lý thuyết hồi quy tuyến tính. Hai công thức chỉ tương đương trong bối cảnh PCA. Trong phân tích nhân tố, họ không và để tính điểm yếu tố (luôn luôn gần đúng trong FA) người ta nên dựa vào công thức thứ hai.
Câu trả lời liên quan của tôi:
Chi tiết hơn về tải trọng vs eigenvector .
Làm thế nào điểm thành phần chính và điểm yếu tố được tính toán .