Làm gì các yếu tố


12

Trong phân tích thành phần chính, thành phần chính đầu tiên là hướng k trực giao với phương sai tối đa. Nói cách khác, thành phần chính thứ nhất được chọn là hướng của phương sai tối đa, thành phần chính thứ hai được chọn là hướng trực giao với hướng thứ nhất với phương sai tối đa, v.v.kk

Có một cách giải thích tương tự cho phân tích nhân tố? Ví dụ, tôi nghĩ rằng các yếu tố đầu tiên là các yếu tố giải thích rõ nhất các thành phần ngoài đường chéo của ma trận tương quan ban đầu (theo nghĩa của lỗi bình phương giữa ma trận tương quan ban đầu và ma trận tương quan được xác định bởi các nhân tố). Điều này có đúng không (hoặc có điều gì đó tương tự mà chúng ta có thể nói)?k


Mặc dù tôi đồng ý với hầu hết mọi thứ @NRH đã viết trong câu trả lời của họ (+1), nhưng câu trả lời ngắn gọn cho câu hỏi cuối cùng của bạn là có, nó hoàn toàn chính xác . Lưu ý rằng trong các yếu tố FA cũng có thể được chọn là trực giao, như trong PCA. Sự khác biệt chỉ là trong việc tái tạo toàn bộ ma trận tương quan (PCA) so với chỉ tái tạo phần ngoài đường chéo của nó (FA). Để thảo luận lâu hơn, hãy xem câu trả lời của tôi trong Điều kiện về sự giống nhau của PCA và Phân tích nhân tốCó lý do chính đáng nào để sử dụng PCA thay vì EFA không?
amip nói phục hồi Monica

Tôi không chắc liệu FA có thực sự "tối thiểu hóa hiệp phương sai một phần bình phương" hay không, bởi vì có một tiêu chí xoay / trích xuất gọi là "MinRes" có lý do chính xác là như vậy. Vậy thì tại sao lại đặt cho nó một cái tên đặc biệt? Có lẽ tiêu chuẩn thói quen cho việc tìm kiếm các FA-giải pháp về mặt toán học có được kết quả giống hệt nhau nếu số lượng các yếu tố k tái tạo các hiệp phương sai một cách hoàn hảo -Nhưng từ k là một ước tính, nó có thể là trong trường hợp không hoàn hảo / đánh giá thấp các FA-giải pháp không phải là giống hệt với giải pháp MinRes. Chà, tôi nói: có thể là - tôi muốn thấy một tuyên bố đầy ẩn ý.
Gottfried Helms

Câu trả lời:


7

PCA chủ yếu là một kỹ thuật giảm dữ liệu trong đó mục tiêu là thu được dữ liệu chiếu lên không gian chiều thấp hơn. Hai mục tiêu tương đương là lặp lại tối đa hóa phương sai hoặc để giảm thiểu lỗi tái cấu trúc. Điều này thực sự được thực hiện trong một số chi tiết trong câu trả lời cho câu hỏi trước đó .

Ngược lại, phân tích nhân tố chủ yếu là một mô hình sinh sản của một chiều vector dữ liệu X nói rằng X = A S + ε nơi Sq vector chiều của yếu tố tiềm ẩn, Mộtp × k với k < pε là một véc tơ lỗi không tương quan. Các Một ma trận là ma trận của tải trọng yếu tố . Điều này mang lại một tham số đặc biệt của ma trận hiệp phương sai là Σ = A A T + DpX

X= =MộtS+ε
SqMộtp×kk<pεMột
Σ=AAT+D
Vấn đề với mô hình này là nó bị quá tải. Cùng một mô hình thu được nếu được thay thế bằng một R cho bất kỳ k × k trực giao ma trận R , có nghĩa là các yếu tố bản thân không phải là độc đáo. Gợi ý khác nhau tồn tại để giải quyết vấn đề này, nhưng có không một giải pháp duy nhất cung cấp cho bạn các yếu tố với các loại giải thích bạn yêu cầu. Một lựa chọn phổ biến là vòng xoay varimax . Tuy nhiên, tiêu chí được sử dụng chỉ xác định vòng quay. Các không gian cột kéo dài bởi Một không thay đổi, và vì đây là một phần của parametrization, nó được xác định bằng phương pháp bất cứ điều gì được sử dụng để ước tính ΣAARk×kRAΣ - bằng khả năng tối đa trong một mô hình Gaussian, nói.

Do đó, để trả lời câu hỏi, các yếu tố được chọn không được đưa ra tự động từ việc sử dụng mô hình phân tích nhân tố, do đó không có cách giải thích duy nhất nào về yếu tố đầu tiên. Bạn phải chỉ định phương thức được sử dụng để ước tính (không gian cột của) A và phương thức được sử dụng để chọn phép quay. Nếu D = σ 2 tôi (tất cả các lỗi có cùng phương sai) là giải pháp MLE cho không gian cột của A là không gian mở rộng ra bởi các lãnh đạo q vectơ thành phần chính, có thể được tìm thấy bởi một phân hủy giá trị duy nhất. Tất nhiên, có thể chọn không xoay và báo cáo các vectơ thành phần chính này làm các yếu tố. kAD=σ2IAq

kkk


1
Đúng, tôi hiểu rằng không có sự lựa chọn duy nhất của các yếu tố k (vì chúng ta có thể xoay chúng và có cùng một mô hình). Nhưng có sự lựa chọn nào của các yếu tố k được lựa chọn bởi phân tích nhân tố thực hiện một số loại "giải thích tối đa về tương quan" không?
raegtin

1
@raegtin, tôi đã chỉnh sửa câu trả lời để giải thích quan điểm của tôi, rằng đây là mô hình của ma trận hiệp phương sai. Bất kỳ sự lựa chọn nào của các yếu tố thu được từ các phép quay đều, như tôi thấy, đều tốt hoặc xấu như nhau trong việc giải thích hiệp phương sai trong dữ liệu khi chúng tạo ra ma trận hiệp phương sai giống nhau.
NRH

1
Cảm ơn đã cập nhật, đây là một lời giải thích tuyệt vời về FA! Vì vậy, khi bạn nói "mục tiêu với mô hình là giải thích tốt nhất hiệp phương sai", bạn có nghĩa là các yếu tố k thực sự làm tối đa hóa lượng hiệp phương sai được giải thích?
raegtin

1
@raegtin, vâng, tôi xem mô hình là mô hình của ma trận hiệp phương sai và khi bạn ước tính mô hình, thật công bằng khi nói rằng bạn đang tối đa hóa lượng hiệp phương sai được giải thích.
NRH

@raegtin và NRH (+1 btw): Chỉ cần làm rõ. Trên hai ý kiến ​​là chính xác nếu bằng "hiệp phương sai", chúng ta hiểu "phần ngoài đường chéo của ma trận hiệp phương sai".
amip nói phục hồi Monica

3

@RAEGTIN, tôi tin rằng bạn nghĩ đúng. Sau khi trích xuất và xoay vòng trước, mỗi yếu tố kế tiếp nhau chiếm ít hơn và ít tương quan hóa, giống như mỗi thành phần kế tiếp chiếm ít và ít phương sai: trong cả hai trường hợp, các cột của ma trận tải A đi theo thứ tự giảm tổng các phần tử bình phương (tải) trong chúng. Đang tải là hệ số bw tương quan và biến; do đó, người ta có thể nói rằng yếu tố thứ nhất giải thích phần lớn nhất của bình phương r "tổng thể" trong ma trận R , yếu tố thứ hai là thứ hai ở đây, v.v. Tuy nhiên, sự khác biệt giữa FA và PCA được "hiệu chỉnh" để khôi phục Rkhá tinh xảo chỉ với m yếu tố được trích xuất (m yếu tố <p biến), trong khi PCA rất thô lỗ trong việc khôi phục nó bởi m thành phần - nó cần tất cả các thành phần p để khôi phục R mà không gặp lỗi.

PS Chỉ cần thêm. Trong FA, giá trị tải "bao gồm" cộng đồng sạch (một phần của phương sai chịu trách nhiệm tương quan) trong khi ở PCA, tải là hỗn hợp của tính cộng đồng và tính đơn nhất của biến và do đó có thể thay đổi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.