Làm cách nào để kết hợp PCA và MCA trên dữ liệu hỗn hợp?


9

Giả sử tôi có dữ liệu hỗn hợp và mã (python) có khả năng thực hiện PCA (phân tích thành phần chính) trên các yếu tố dự đoán liên tục và MCA (phân tích nhiều tương ứng) trên các yếu tố dự đoán danh nghĩa. Có thể kết hợp các kết quả từ PCA và MCA thành một không?

Câu trả lời:


8

Bạn có thể muốn sử dụng phân tích nhân tố của dữ liệu hỗn hợp .

Nó cho phép bạn thực hiện giảm kích thước trên một bộ dữ liệu hoàn chỉnh.

Việc triển khai AR có thể được tìm thấy trong gói FactoMineR. Nhưng chức năng này đấu tranh khi bạn có số lượng dữ liệu / cột cao.

Tôi không nhận thức được sự tồn tại của tương đương trong trăn.


Cảm ơn bạn, tôi đã đọc về FAMD trước đây, điều không may là dường như chỉ có hỗ trợ R - do đó câu hỏi của tôi. Điều tối thiểu tôi có thể làm bây giờ là xử lý kết quả của cả hai phương pháp (PCA & MCA). Tuy nhiên, nếu có một cách để 'trộn' chúng lại với nhau để mang lại một bộ dữ liệu nguyên khối thì đây là câu trả lời tôi đang tìm kiếm.
Wojciech Migda

Ok, hóa ra bộ dữ liệu của tôi đủ lớn để thực hiện MCA trong tay để hết bộ nhớ.
Wojciech Migda

Đây là một vấn đề thường xuyên tôi nhận được với việc thực hiện R. Nếu bạn có một bộ biến giới hạn, hãy cố gắng cân nhắc các quan sát của bạn. Hoặc chỉ sử dụng một tập hợp con của quan sát của bạn. Mặt khác, bạn có thể cố gắng chuyển đổi biến số của mình thành loại thứ tự hoặc để biến đổi các biến định tính của bạn thành cờ.
YCR


1

Tôi đang tìm kiếm điều tương tự trong Python và tôi đã đến gói hoàng tử đã thực hiện FAMD.


1

Tôi không có đủ điểm để nhận xét nên trả lời ở đây Gói hoàng tử @Edo chỉ có CA, MCA và PCA PAckages trong đó. Tôi không thấy bất kỳ FAMD nào ở đây.

dir(prince)

['CA', 'MCA', 'PCA', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', 'ca', 'mca', 'pca', 'plot', 'svd']

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.