PCA chủ yếu là một kỹ thuật giảm dữ liệu trong đó mục tiêu là thu được dữ liệu chiếu lên không gian chiều thấp hơn. Hai mục tiêu tương đương là lặp lại tối đa hóa phương sai hoặc để giảm thiểu lỗi tái cấu trúc. Điều này thực sự được thực hiện trong một số chi tiết trong câu trả lời cho câu hỏi trước đó .
Ngược lại, phân tích nhân tố chủ yếu là một mô hình sinh sản của một chiều vector dữ liệu X nói rằng
X = A S + ε
nơi S là q vector chiều của yếu tố tiềm ẩn, Một là p × k với k < p và ε là một véc tơ lỗi không tương quan. Các Một ma trận là ma trận của tải trọng yếu tố . Điều này mang lại một tham số đặc biệt của ma trận hiệp phương sai là
Σ = A A T + DpX
X= A S+ ε
SqMộtp × kk < pεMộtΣ=AAT+D
Vấn đề với mô hình này là nó bị quá tải. Cùng một mô hình thu được nếu
được thay thế bằng
một R cho bất kỳ
k × k trực giao ma trận
R , có nghĩa là các yếu tố bản thân không phải là độc đáo. Gợi ý khác nhau tồn tại để giải quyết vấn đề này, nhưng có
không một giải pháp duy nhất cung cấp cho bạn các yếu tố với các loại giải thích bạn yêu cầu. Một lựa chọn phổ biến là vòng xoay
varimax . Tuy nhiên, tiêu chí được sử dụng chỉ xác định vòng quay. Các không gian cột kéo dài bởi
Một không thay đổi, và vì đây là một phần của parametrization, nó được xác định bằng phương pháp bất cứ điều gì được sử dụng để ước tính
ΣAARk×kRAΣ - bằng khả năng tối đa trong một mô hình Gaussian, nói.
Do đó, để trả lời câu hỏi, các yếu tố được chọn không được đưa ra tự động từ việc sử dụng mô hình phân tích nhân tố, do đó không có cách giải thích duy nhất nào về yếu tố đầu tiên. Bạn phải chỉ định phương thức được sử dụng để ước tính (không gian cột của) A và phương thức được sử dụng để chọn phép quay. Nếu D = σ 2 tôi (tất cả các lỗi có cùng phương sai) là giải pháp MLE cho không gian cột của A là không gian mở rộng ra bởi các lãnh đạo q vectơ thành phần chính, có thể được tìm thấy bởi một phân hủy giá trị duy nhất. Tất nhiên, có thể chọn không xoay và báo cáo các vectơ thành phần chính này làm các yếu tố. kAD=σ2IAq
kkk