Các phép biến đổi dữ liệu trên dữ liệu không bình thường có cần thiết cho phân tích nhân tố khám phá khi sử dụng phương pháp trích xuất bao thanh toán trục chính không?


9

Tôi đang phát triển một bảng câu hỏi để đo lường bốn yếu tố cấu thành tâm linh và tôi muốn hỏi câu hỏi sau:

Các phép biến đổi dữ liệu trên dữ liệu không bình thường có cần thiết cho phân tích nhân tố khám phá khi sử dụng phương pháp trích xuất bao thanh toán trục chính không?

Tôi đã hoàn tất việc kiểm tra dữ liệu của mình ngày hôm qua và tôi thấy rằng 3 trong số 20 câu hỏi bị sai lệch tích cực trong khi 1 trong số 20 câu bị sai lệch (Câu 6 = 4,88, Câu 9 = 7,22, Câu 12 = 11,11, Câu 16 = -6,26). Tôi cũng thấy rằng 1 trong số các câu hỏi (trong số 20) là leptokurtic (Câu 12 = 12,21).

Tôi đã chọn phương pháp trích xuất bao thanh toán trục chính bởi vì tôi đọc rằng nó được sử dụng trên "dữ liệu không bình thường nghiêm trọng" trong khi khả năng tối đa được sử dụng trên dữ liệu thông thường, nhưng:

  1. Làm thế nào để tôi biết nếu dữ liệu của tôi "nghiêm trọng" không bình thường?

  2. Nếu dữ liệu của tôi là "không bình thường", điều này có nghĩa là tôi có thể để lại dữ liệu như hiện tại (không chuyển đổi dữ liệu) và phân tích dữ liệu bằng phương pháp trích xuất bao thanh toán trục chính? Hay tôi cần phải chuyển đổi dữ liệu trước khi tiếp tục với EFA?

  3. Nếu tôi cần phải chuyển đổi dữ liệu, tôi sẽ sử dụng những biến đổi nào cho các mặt hàng bị lệch, lệch âm và leptokurtic tích cực?

Câu trả lời:


10

Phân tích nhân tố thực chất là mô hình hồi quy tuyến tính (bị ràng buộc). Trong mô hình này, mỗi biến được phân tích là biến phụ thuộc, các yếu tố phổ biến là IV và yếu tố duy nhất ngụ ý đóng vai trò là thuật ngữ lỗi. (Thuật ngữ không đổi được đặt thành 0 do định tâm hoặc tiêu chuẩn hóa được ngụ ý trong tính toán hiệp phương sai hoặc tương quan.) và lỗi (yếu tố duy nhất) là bình thường, điều này tự động dẫn đến việc DV là bình thường; và giả định "yếu" về tính quy tắc - lỗi (yếu tố duy nhất) chỉ là bình thường, do đó, DV không cần phải bình thường. Cả trong hồi quy và FA, chúng ta thường thừa nhận giả định "yếu" vì nó thực tế hơn.

Trong số các phương pháp trích xuất FA cổ điển chỉ có phương pháp khả năng tối đa, bởi vì nó rời khỏi các đặc điểm của dân số, nói rằng các biến được phân tích là đa biến thông thường. Các phương pháp như trục chính hoặc phần dư tối thiểu không yêu cầu giả định "mạnh" này (mặc dù bạn có thể thực hiện bằng mọi cách).

Xin nhớ rằng ngay cả khi các biến của bạn là bình thường riêng biệt, điều đó không nhất thiết đảm bảo rằng dữ liệu của bạn là đa biến bình thường.

Chúng ta hãy chấp nhận giả định "yếu" về tính quy tắc. Mối đe dọa tiềm tàng đến từ dữ liệu bị sai lệch mạnh mẽ, như của bạn là gì? Nó là ngoại lệ. Nếu sự phân bố của một biến không đối xứng mạnh thì đuôi dài sẽ trở nên có ảnh hưởng lớn hơn trong tương quan điện toán hoặc hiệp phương sai, và đồng thời nó gây ra sự e ngại về việc liệu nó vẫn đo cùng một cấu trúc tâm lý (yếu tố) như đuôi ngắn hơn. Có thể thận trọng khi so sánh liệu ma trận tương quan được xây dựng ở nửa dưới và nửa trên của thang đánh giá có tương tự nhau hay không. Nếu chúng đủ giống nhau, bạn có thể kết luận rằng cả hai đuôi đo cùng một thứ và không biến đổi các biến của bạn. Nếu không, bạn nên xem xét chuyển đổi hoặc một số hành động khác để vô hiệu hóa hiệu ứng của đuôi dài "ngoại lệ".

Biến đổi là rất nhiều. Ví dụ: nâng lên công suất> 1 hoặc lũy thừa được sử dụng cho dữ liệu bị lệch trái và công suất <1 hoặc logarit - cho độ lệch phải. Kinh nghiệm của riêng tôi nói rằng cái gọi là chuyển đổi tối ưu thông qua PCA phân loại được thực hiện trước FA hầu như luôn có lợi, vì nó thường dẫn đến các yếu tố rõ ràng hơn, có thể hiểu được trong FA; theo giả định rằng số lượng các yếu tố đã biết, nó biến đổi dữ liệu của bạn một cách phi tuyến tính để tối đa hóa phương sai tổng thể được tính bởi số lượng các yếu tố đó.


Cảm ơn câu trả lời của bạn! Và bạn có khuyên bạn nên loại bỏ câu hỏi 12 vì nó vừa bị lệch dương vừa leptokurtic, hay sẽ tốt hơn nếu để nó lại và biến đổi nó?
Madeline

Tôi không kiềm chế lời khuyên trực tiếp, không ở trong đôi giày của bạn. Nói một cách tổng quát nhất, các câu hỏi rất sai lệch (= quá khó hoặc quá dễ) hoặc leptokurtic (không nhạy cảm với sự khác biệt giữa những người trả lời điển hình) là những câu hỏi "xấu" về mặt tâm lý và đáng để xem lại.
ttnphns

1

Tôi chỉ đăng những gì tôi học được từ Yong và Pearce (2013).

Để thực hiện phân tích nhân tố, cần phải có tính quy phạm đơn biến và đa biến trong dữ liệu (Trẻ em, 2006)

Yong, AG, & Pearce, S. (2013). Hướng dẫn cho người mới bắt đầu phân tích nhân tố: Tập trung vào phân tích nhân tố khám phá. Hướng dẫn về phương pháp định lượng cho tâm lý học , 9 (2), 79-94. DOI: 10.20982 / tqmp.09.2.p079

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.