Phân tích PCA và yếu tố truyền thống (tuyến tính) yêu cầu dữ liệu ở cấp độ tỷ lệ (khoảng hoặc tỷ lệ). Thông thường dữ liệu đánh giá kiểu likeert được coi là cấp độ tỷ lệ, vì dữ liệu đó dễ phân tích hơn. Và quyết định đôi khi được bảo đảm về mặt thống kê, đặc biệt là khi số lượng danh mục được đặt hàng lớn hơn 5 hoặc 6. (Mặc dù hoàn toàn là câu hỏi về loại dữ liệu và số mức quy mô là khác biệt.)
Điều gì sẽ xảy ra nếu bạn thích coi thang đo polytomous như là thứ tự? Hoặc bạn có dữ liệu nhị phân? Có thể làm phân tích nhân tố khám phá hoặc PCA cho họ?
Hiện tại có ba phương pháp chính để thực hiện FA (bao gồm PCA là trường hợp đặc biệt của nó) trên phân loại thứ tự hoặc các biến nhị phân (đọc cũng này tài khoản về trường hợp dữ liệu nhị phân, và này xem xét về những gì có thể được thực hiện với quy mô thứ tự).
Phương pháp mở rộng quy mô tối ưu (một họ ứng dụng ). Cũng được gọi là PCA phân loại (CatPCA) hoặc FA phi tuyến. Trong CatPCA, các biến số thứ tự được biến đổi đơn điệu ("định lượng") thành các phiên bản khoảng "cơ bản" của chúng theo mục tiêu để tối đa hóa phương sai được giải thích bởi số lượng thành phần chính được chọn trích xuất từ dữ liệu khoảng đó. Điều này làm cho phương pháp công khai hướng đến mục tiêu (chứ không phải dựa trên lý thuyết) và quan trọng là quyết định trước số lượng các thành phần chính. Nếu FA thực sự là cần thiết thay vì PCA, thì FA tuyến tính thông thường có thể được thực hiện một cách tự nhiên trên các đầu ra biến đổi từ CatPCA. Với các biến nhị phân, CatPCA (đáng tiếc?) Hành xử theo cách của PCA thông thường, nghĩa là, như thể chúng là các biến liên tục. CatPCA cũng chấp nhận các biến danh nghĩa và bất kỳ hỗn hợp các loại biến (đẹp).
Suy ra cách tiếp cận biến cơ bản . Còn được gọi là PCA / FA được thực hiện trên các mối tương quan tetrachoric (đối với dữ liệu nhị phân) hoặc polychoric (đối với dữ liệu thứ tự). Phân phối chuẩn được giả định cho biến liên tục bên dưới (sau đó được đánh dấu) cho mỗi biến số của bảng kê khai. Sau đó FA cổ điển được áp dụng để phân tích các mối tương quan nói trên. Cách tiếp cận dễ dàng cho phép kết hợp dữ liệu nhị phân, thứ tự, nhị phân. Một nhược điểm của phương pháp này là - trong việc suy ra các mối tương quan - nó không có manh mối nào về phân phối đa biến của các biến cơ bản, - có thể "hình dung" ở hầu hết các phân phối bivariate, do đó không dựa trên thông tin đầy đủ.
Mục tiếp cận lý thuyết đáp ứng (IRT). Đôi khi cũng được gọi là FA logistic hoặc phân tích đặc điểm tiềm ẩn . Một mô hình rất gần với logit nhị phân (đối với dữ liệu nhị phân) hoặc mô hình tỷ lệ cược log tỷ lệ (đối với dữ liệu thứ tự) được áp dụng. Thuật toán không bị ràng buộc với việc phân tách ma trận tương quan, do đó, nó hơi khác với FA truyền thống, nhưng nó vẫn là một FA phân loại trung thực. "Thông số phân biệt đối xử" tương ứng chặt chẽ với tải của FA, nhưng "khó khăn" thay thế khái niệm "tính duy nhất" của FA. Sự chắc chắn phù hợp IRT nhanh chóng giảm khi số lượng các yếu tố tăng lên, đó là một vấn đề của phương pháp này. IRT có thể mở rộng theo cách riêng của mình để kết hợp các biến hỗn hợp + nhị phân + thứ tự và có thể là danh nghĩa.
Điểm yếu tố trong các cách tiếp cận (2) và (3) khó ước tính hơn so với điểm yếu tố trong FA cổ điển hoặc theo cách tiếp cận (1). Tuy nhiên, một số phương pháp tồn tại (phương pháp aposteriori dự kiến hoặc tối đa, phương pháp khả năng tối đa, v.v.).
Các giả định mô hình phân tích nhân tố chủ yếu giống nhau trong ba cách tiếp cận như trong FA truyền thống. Cách tiếp cận (1) có sẵn trong R, SPSS, SAS (theo ý tôi). Phương pháp tiếp cận (2) và (3) được triển khai chủ yếu trong các gói biến tiềm ẩn chuyên biệt - Mplus, LISREL, EQS.
Cách tiếp cận đa thức. Điều đó chưa được phát triển đầy đủ. Các thành phần chính có thể được mô hình hóa thành các tổ hợp biến đa thức ( sử dụng đa thức là một cách phổ biến để mô hình hóa các hiệu ứng phi tuyến của các hồi quy thứ tự.). Ngoài ra, các loại quan sát lần lượt có thể được mô hình thành các biểu hiện riêng biệt của sự kết hợp đa thức của các yếu tố tiềm ẩn.
Có tồn tại một lĩnh vực hưng thịnh của các kỹ thuật phi tuyến giảm chiều; một số trong số chúng có thể được áp dụng hoặc chấp nhận để làm việc với dữ liệu phân loại (đặc biệt là nhị phân hoặc sau khi tạo thành một bộ dữ liệu thưa thớt chiều cao).
r
Nhìn cũng trong này , này , này , này , này , này , này , này .