Các biến xiên trong PCA hoặc phân tích nhân tố


9

Tôi muốn thực hiện phân tích thành phần chính (phân tích nhân tố) trên SPSS dựa trên 22 biến. Tuy nhiên, một số biến của tôi rất sai lệch (độ lệch được tính từ SPSS nằm trong khoảng từ 2 chàng80!).

Vì vậy, đây là những câu hỏi của tôi:

  1. Tôi có nên giữ các biến bị lệch như thế hay tôi có thể chuyển đổi các biến trên phân tích thành phần chính? Nếu có, làm thế nào tôi giải thích điểm yếu tố?

  2. Tôi nên làm loại chuyển đổi nào? log10 hay ln?

  3. Ban đầu, KMO của tôi (Kaiser, Meyer Mey Olkin) là 0,413. Nhiều tài liệu khuyến nghị tối thiểu 0,5. Tôi vẫn có thể phân tích nhân tố hay tôi cần loại bỏ các biến để nâng KMO của mình lên 0,5?


5
Một lưu ý: PCA không giống như phân tích nhân tố. PCA là một phương pháp giảm dữ liệu, FA là một nỗ lực để tìm các biến tiềm ẩn. Họ thường (nhưng không phải luôn luôn) cho kết quả tương tự
Peter Flom

Câu trả lời:


9
  1. Vấn đề Skewness trong PCA cũng giống như trong hồi quy: đuôi dài hơn, nếu nó thực sự dài so với toàn bộ phạm vi phân phối, thực sự hoạt động giống như một ngoại lệ lớn, nó kéo mạnh đường thẳng (thành phần chính trong trường hợp của bạn) chính nó vì ảnh hưởng của nó được tăng cường; ảnh hưởng của nó được tăng cường bởi vì nó là xa trung bình. Trong bối cảnh PCA cho phép các biến rất sai lệch khá giống với làm PCA mà không cần định tâm dữ liệu (nghĩa là thực hiện PCA trên cơ sở ma trận cosine thay vì ma trận tương quan). Chính bạnngười quyết định có cho phép cái đuôi dài ảnh hưởng rất lớn đến kết quả (và để dữ liệu được) hay không (và biến đổi dữ liệu). Vấn đề không liên quan đến cách bạn giải thích các tải.

  2. Như bạn thích.

  3. KMO là một chỉ số cho bạn biết liệu tương quan một phần có hợp lý nhỏ để gửi dữ liệu để phân tích nhân tố hay không. Bởi vì trong phân tích nhân tố, chúng ta thường mong đợi một yếu tố tải nhiều hơn chỉ hai biến. KMO của bạn đủ thấp. Bạn có thể làm cho nó tốt hơn nếu bạn thả từ các biến phân tích có giá trị KMO riêng lẻ thấp (chúng tạo thành đường chéo của ma trận chống hình ảnh , bạn có thể yêu cầu hiển thị ma trận này trong quy trình SPSS Factor). Có thể tranforming biến thành ít phục hồi KMO? Ai biết. Có lẽ. Lưu ý rằng KMO quan trọng chủ yếu trong mô hình phân tích nhân tố, không phải mô hình phân tích thành phần chính: trong FA bạn phù hợp với các mối tương quan theo cặp, trong khi đó trong PCA thì không.


2

+1 thành @ttnphns, tôi chỉ muốn mở rộng một chút ở điểm # 2. Các biến đổi thường được sử dụng để ổn định xiên. Như @ttnphns chỉ ra, bạn sẽ sử dụng những thứ này trước khi bạn chạy các phân tích của mình. Biến đổi nhật ký là một phần của họ biến đổi sức mạnh Box-Cox. Bạn sẽ muốn xem xét một phạm vi biến đổi có thể rộng hơn thay vì chỉ các bản ghi (ví dụ: căn bậc hai, đối ứng, v.v.). Sự lựa chọn giữa các cơ sở logarit khác nhau không ảnh hưởng đến sức mạnh của sự biến đổi. Khi mọi người sẽ làm việc toán học với biến được chuyển đổi, nhật ký tự nhiên đôi khi được ưa thích hơn, vì nhật ký tự nhiên có thể làm cho toán sạch hơn trong một số trường hợp. Nếu bạn không quan tâm đến điều đó, bạn có thể muốn chọn một cơ sở sẽ tạo điều kiện cho việc giải thích. Nghĩa là, mỗi đơn vị tăng trong thang đo mới sẽ đại diện cho một cơ sởtăng gấp đôi so với tỷ lệ ban đầu (ví dụ: nếu bạn đã sử dụng cơ sở nhật ký 2, thì mỗi đơn vị sẽ tăng gấp 2 lần, cơ sở 10 có nghĩa là mọi đơn vị sẽ tăng gấp 10 lần, v.v.), vì vậy nó có thể tốt để chọn một cơ sở sao cho dữ liệu của bạn sẽ trải rộng trên một số đơn vị theo tỷ lệ được chuyển đổi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.