Định lý cơ bản của Dịch vụ phân tích nhân tố học áp dụng cho PCA như thế nào, hoặc tải PCA được định nghĩa như thế nào?


14

Tôi hiện đang trải qua một bộ slide tôi có để "phân tích nhân tố" (PCA theo như tôi có thể nói).

Trong đó, "định lý cơ bản của phân tích nhân tố" được đưa ra, tuyên bố rằng ma trận tương quan của dữ liệu đi vào phân tích ( ) có thể được phục hồi bằng cách sử dụng ma trận tải nhân tố (R ):A

R=AA

Điều này tuy nhiên làm tôi bối rối. Trong PCA, ma trận "tải nhân tố" được đưa ra bởi ma trận các hàm riêng của ma trận hiệp phương sai / tương quan của dữ liệu (vì chúng tôi giả sử rằng dữ liệu đã được chuẩn hóa, chúng giống nhau), với mỗi hàm riêng được chia tỷ lệ chiều dài một. Ma trận này là trực giao, do đó mà là nói chung không bằng R .AA=IR


In addition to @amoeba's answer, look in my answer addresing the terminologic ambiguety. I do not recommend to call eigenvectors matrix A (which are loadings), for reasons of clarity. The (right-side) eigenvector matrix is usually labeled V (because R=USV' by svd), not A. Another equivalent name (coming from biplot terminology) for eigenvectors is "standard coordinates", and for loadings is "principal coordinates".
ttnphns

( "tọa độ tiêu chuẩn" - bởi vì quán tính, hoặc quy mô của các giá trị riêng, là đơn vị cường độ khi endowing họ;. "tọa độ chính" - bởi vì nó là bản gốc độ đầy đủ khi endowing họ)
ttnphns

Câu trả lời:


17

Đây là một câu hỏi hợp lý (+1) bắt nguồn từ sự mơ hồ thuật ngữ và nhầm lẫn.

In the context of PCA, people often call principal axes (eigenvectors of the covariance/correlation matrix) "loadings". This is sloppy terminology. What should rather be called "loadings" in PCA, are principal axes scaled by the square roots of the respective eigenvalues. Then the theorem you are referring to will hold.

Indeed, if the eigen-decomposition of the correlation matrix is

R=VSV
where V are eigenvectors (principal axes) and S is a diagonal matrix of eigenvalues, and if we define loadings as
A=VS1/2,
then one can easily see that
R=AA.
Moreover, the best rank-r approximation to the correlation matrix is given by the first r PCA loadings:
RArAr.

Please see my answer here for more about reconstructing covariance matrices with factor analysis and PCA loadings.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.