Tôi đã thực hiện phân tích thành phần chính (PCA) với R bằng hai hàm khác nhau ( prcomp
và princomp
) và nhận thấy rằng điểm PCA khác nhau về dấu hiệu. Làm thế nào nó có thể được?
Xem xét điều này:
set.seed(999)
prcomp(data.frame(1:10,rnorm(10)))$x
PC1 PC2
[1,] -4.508620 -0.2567655
[2,] -3.373772 -1.1369417
[3,] -2.679669 1.0903445
[4,] -1.615837 0.7108631
[5,] -0.548879 0.3093389
[6,] 0.481756 0.1639112
[7,] 1.656178 -0.9952875
[8,] 2.560345 -0.2490548
[9,] 3.508442 0.1874520
[10,] 4.520055 0.1761397
set.seed(999)
princomp(data.frame(1:10,rnorm(10)))$scores
Comp.1 Comp.2
[1,] 4.508620 0.2567655
[2,] 3.373772 1.1369417
[3,] 2.679669 -1.0903445
[4,] 1.615837 -0.7108631
[5,] 0.548879 -0.3093389
[6,] -0.481756 -0.1639112
[7,] -1.656178 0.9952875
[8,] -2.560345 0.2490548
[9,] -3.508442 -0.1874520
[10,] -4.520055 -0.1761397
Tại sao các dấu hiệu ( +/-
) khác nhau cho hai phân tích? Nếu sau đó tôi đang sử dụng các thành phần chính PC1
và PC2
như các yếu tố dự báo trong hồi quy, nghĩa là lm(y ~ PC1 + PC2)
, điều này sẽ thay đổi hoàn toàn sự hiểu biết của tôi về tác động của hai biến y
phụ thuộc vào phương pháp tôi đã sử dụng! Làm thế nào tôi có thể nói rằng PC1
có ảnh hưởng tích cực đến y
và PC2
có ảnh hưởng tiêu cực đến y
?
Ngoài ra: Nếu dấu hiệu của các thành phần PCA là vô nghĩa, điều này có đúng với phân tích nhân tố (FA) không? Có thể chấp nhận lật (đảo ngược) dấu hiệu của điểm thành phần PCA / FA riêng lẻ (hoặc của tải, như một cột của ma trận tải) không?