Phương pháp trích xuất nhân tố tốt nhất trong phân tích nhân tố


29

SPSS cung cấp một số phương pháp trích xuất nhân tố:

  1. Thành phần chính (hoàn toàn không phải là phân tích nhân tố)
  2. Bình phương nhỏ nhất không trọng số
  3. Bình phương tối thiểu
  4. Khả năng tối đa
  5. Trục chính
  6. Bao thanh toán Alpha
  7. Bao thanh toán hình ảnh

Bỏ qua phương pháp đầu tiên, không phải là phân tích nhân tố (mà là phân tích thành phần chính, PCA), phương pháp nào là "tốt nhất"? Những lợi thế tương đối của các phương pháp khác nhau là gì? Và về cơ bản, tôi sẽ chọn cái nào để sử dụng?

Câu hỏi bổ sung: người ta có nên thu được kết quả tương tự từ tất cả 6 phương pháp không?


Hmm, sự thúc đẩy đầu tiên của tôi: không có mục wikipedia về điều này? Nếu không - chắc chắn nên tồn tại một ...
Gottfried Helms

4
Vâng, có một bài viết trên wikipedia. Nó nói sử dụng MLE nếu dữ liệu bình thường và PAF khác. Nó không nói nhiều về giá trị hoặc mặt khác của các tùy chọn khác. Trong mọi trường hợp, tôi sẽ rất vui khi biết các thành viên của trang web này nghĩ gì về vấn đề này, dựa trên kinh nghiệm thực tế của họ.
Placidia

Câu trả lời:


41

Để làm cho nó ngắn. Hai phương thức cuối cùng là mỗi phương thức rất đặc biệt và khác với các số 2-5. Chúng đều được gọi là phân tích nhân tố chung và thực sự được xem như là sự thay thế. Hầu hết thời gian, họ cho kết quả khá giống nhau . Chúng là "chung" vì chúng đại diện cho mô hình nhân tố cổ điển , các yếu tố chung + mô hình nhân tố duy nhất. Đây là mô hình thường được sử dụng trong phân tích / xác nhận câu hỏi.

Trục chính (PAF) , còn gọi là Yếu tố chính với các lần lặp là phương pháp lâu đời nhất và có lẽ khá phổ biến. Đó là lặp đi lặp lại PCA ứng dụng để ma trận nơi communalities đứng trên đường chéo ở vị trí của 1s hoặc chênh lệch. Mỗi lần lặp lại tiếp theo sẽ tinh chỉnh các cộng đồng hơn nữa cho đến khi chúng hội tụ. Khi làm như vậy, phương pháp tìm cách giải thích phương sai, không tương quan cặp, cuối cùng giải thích các mối tương quan. Phương pháp trục chính có lợi thế ở chỗ nó có thể, như PCA, phân tích không chỉ các mối tương quan, mà còn cả hiệp phương sai và các phương thức khác1Các biện pháp SSCP (sscp thô, cosin). Ba phương pháp còn lại chỉ xử lý các mối tương quan [trong SPSS; hiệp phương sai có thể được phân tích trong một số triển khai khác]. Phương pháp này phụ thuộc vào chất lượng của các ước tính bắt đầu của cộng đồng (và đó là nhược điểm của nó). Thông thường, nhiều tương quan / hiệp phương sai bình phương được sử dụng làm giá trị bắt đầu, nhưng bạn có thể thích các ước tính khác (bao gồm cả các ước tính được lấy từ nghiên cứu trước đó). Xin vui lòng đọc này để biết thêm. Nếu bạn muốn xem một ví dụ về tính toán bao thanh toán trục chính, đã nhận xét và so sánh với tính toán PCA, vui lòng xem tại đây .

Bình phương tối thiểu hoặc bình phương tối thiểu (ULS) là thuật toán nhằm trực tiếp giảm thiểu phần dư giữa ma trận tương quan đầu vào và ma trận tương quan được sao chép (bởi các yếu tố) (trong khi các yếu tố đường chéo là tổng của tính cộng đồng và tính duy nhất nhằm khôi phục 1s) . Đây là nhiệm vụ thẳng của FA . Phương pháp ULS có thể hoạt động với ma trận tương quan nửa số đơn và thậm chí không tích cực với điều kiện số lượng các yếu tố nhỏ hơn thứ hạng của nó, - mặc dù có thể nghi ngờ nếu FA về mặt lý thuyết là phù hợp.2

Bình phương tối thiểu hoặc có trọng số (GLS) là một sửa đổi của hình trước. Khi giảm thiểu các phần dư, nó đánh giá các hệ số tương quan một cách khác biệt: mối tương quan giữa các biến có độ không cao (ở lần lặp hiện tại) được cho trọng số ít hơn . Sử dụng phương pháp này nếu bạn muốn các yếu tố của mình phù hợp với các biến có tính độc đáo cao (nghĩa là các yếu tố bị điều khiển yếu bởi các yếu tố) tệ hơn các biến rất phổ biến (nghĩa là được điều khiển mạnh bởi các yếu tố). Mong muốn này không phải là hiếm, đặc biệt là trong quá trình xây dựng bảng câu hỏi (ít nhất là tôi nghĩ vậy), vì vậy khách sạn này là lợi thế .34

Khả năng tối đa (ML)giả định dữ liệu (các mối tương quan) đến từ dân số có phân phối chuẩn nhiều biến số (các phương pháp khác không có giả định như vậy) và do đó phần dư của các hệ số tương quan phải được phân phối bình thường quanh 0. Các tải trọng được ước tính theo phương pháp ML theo giả định trên. Việc xử lý các mối tương quan được cân nhắc bởi uniqness theo cùng một cách như trong phương pháp bình phương tối thiểu. Mặc dù các phương pháp khác chỉ phân tích mẫu, nhưng phương pháp ML cho phép suy luận về dân số, một số chỉ số phù hợp và khoảng tin cậy thường được tính toán cùng với nó [không may, chủ yếu không phải trong SPSS, mặc dù mọi người đã viết macro cho SPSS. nó]

Tất cả các phương pháp tôi mô tả ngắn gọn là mô hình tiềm ẩn tuyến tính, liên tục. "Tuyến tính" ngụ ý rằng các mối tương quan xếp hạng, ví dụ, không nên được phân tích. "Liên tục" ngụ ý rằng dữ liệu nhị phân, chẳng hạn, không nên được phân tích (IRT hoặc FA dựa trên mối tương quan tetrachoric sẽ phù hợp hơn).


1 Vì ma trận tương quan (hoặc hiệp phương sai) , - sau khi các cộng đồng ban đầu được đặt trên đường chéo của nó, thường sẽ có một số giá trị riêng âm, chúng phải được giữ sạch; do đó PCA nên được thực hiện bằng cách phân tách riêng, không phải SVD.R

2 Phương pháp ULS bao gồm phân tích lặp lại ma trận tương quan giảm, như PAF, nhưng trong một quy trình tối ưu hóa phức tạp hơn, Newton-Raphson nhằm tìm ra các phương sai duy nhất ( , tính duy nhất) mà tại đó các mối tương quan được tái cấu trúc một cách tối đa. Khi làm như vậy, ULS xuất hiện tương đương với phương pháp gọi là MINRES (chỉ các tải được trích xuất có vẻ như được quay một cách trực giao so với MINRES) được biết là trực tiếp giảm thiểu tổng số dư của bình phương tương quan.u2

3 thuật toán GLS và ML về cơ bản là ULS, nhưng quá trình lặp lại trên các lần lặp được thực hiện trên ma trận (hoặc trên ), để kết hợp các tính duy nhất như trọng lượng. ML khác với GLS trong việc áp dụng kiến ​​thức về xu hướng eigenvalue dự kiến ​​trong phân phối bình thường.uR1uu1Ru1

4 Thực tế là các mối tương quan được tạo ra bởi các biến ít phổ biến hơn được phép phù hợp tệ hơn có thể (tôi phỏng đoán như vậy) tạo cơ hội cho sự hiện diện của các mối tương quan một phần (không cần giải thích), điều này có vẻ tốt. Mô hình nhân tố chung thuần túy "mong đợi" không có tương quan một phần, điều này không thực tế lắm.

nhập mô tả hình ảnh ở đây


Tôi nghĩ, người ta nên thêm nhiều khía cạnh: liệu chúng ta có sử dụng các phương pháp để phù hợp với giải pháp nhân tố cho số lượng yếu tố được chỉ định trước hay không, liệu số lượng yếu tố sẽ xuất hiện từ dữ liệu, theo một số tiêu chí (eigenvalue, screetest, ...) . Theo tôi hiểu, ML chỉ hợp lý nếu bạn định trước một số yếu tố, và sau đó một giải pháp nhân tố sẽ được tìm kiếm, và thậm chí có thể kiểm tra chi bình phương. PCA cho phép số lượng các yếu tố xuất hiện linh hoạt bởi các thuộc tính dữ liệu, được đưa ra một số tiêu chí, không có kiểm tra chi bình phương. PAF có thể được sử dụng theo cả hai cách.
Gottfried Helms

1
@Gottfried, tôi không đồng ý với cách bạn đặt nó. Tất cả các phương thức FA yêu cầu số lượng yếu tố m được biết: bạn phù hợp với mô hình cho m bạn chỉ định. Bạn có thể sử dụng các tiêu chí khác nhau có thể giúp quyết định m , nhưng tất cả những điều này không phải là một phần của phương pháp trích xuất nhân tố. Ngoại trừ chi bình phương đó, được tính toán cùng với các phương thức GLS và ML. Ngoài ra, với phương pháp PA, nếu bạn biết trước các cộng đồng thực sự (điều này rất hiếm khi), bạn có thể làm cho họ hướng dẫn bạn hướng tới m tốt nhất . Nhưng trong mọi trường hợp, chính bạn, không phải là thuật toán trích xuất, quyết định m .
ttnphns

Bây giờ chúng ta nên sử dụng cái gì? Cái nào là tốt nhất?
MrYouMath

1
Tốt nhất là những gì bạn thích nhất. Bạn chọn, sau đó nếu cần bạn giải thích tại sao nó phù hợp với bạn. Như mọi nơi.
ttnphns

@ ttnphns, có nguyên tắc when to use whichnào không?
kittygirl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.