Thành phần chính là sự kết hợp tuyến tính có trọng số của tất cả các yếu tố của bạn (X's).
ví dụ: PC1 = 0,1X1 + 0,3X2
Sẽ có một thành phần cho mỗi yếu tố (mặc dù nói chung một số lượng nhỏ được chọn).
Các thành phần được tạo ra sao cho chúng có mối tương quan bằng không (là trực giao), theo thiết kế.
Do đó, thành phần PC1 không nên giải thích bất kỳ biến thể nào trong thành phần PC2.
Bạn có thể muốn thực hiện hồi quy trên biến Y của bạn và đại diện PCA của X của bạn, vì chúng sẽ không có đa cộng tuyến. Tuy nhiên, điều này có thể khó diễn giải.
Nếu bạn có nhiều X hơn các quan sát, phá vỡ OLS, bạn có thể hồi quy các thành phần của mình và chỉ cần chọn một số lượng nhỏ hơn các thành phần biến thể cao nhất.
Phân tích thành phần chính của Jollife một cuốn sách rất chuyên sâu và được trích dẫn nhiều về chủ đề này
Điều này cũng tốt: http://www.statsoft.com/textbook/principal-components-factor-analysis/
r
thẻ và ý của bạn là "tại sao lại như vậy"? PC không tương quan với nhau, tức là chúng trực giao, phụ gia, bạn không thể dự đoán PC này với PC khác. Bạn đang tìm kiếm một công thức?