Tôi muốn giảm tính chiều của các hệ thống bậc cao hơn và nắm bắt hầu hết hiệp phương sai trên trường tốt nhất là 2 chiều hoặc 1 chiều. Tôi hiểu điều này có thể được thực hiện thông qua phân tích thành phần chính và tôi đã sử dụng PCA trong nhiều tình huống. Tuy nhiên, tôi chưa bao giờ sử dụng nó với các kiểu dữ liệu boolean và tôi tự hỏi liệu việc làm PCA với bộ này có ý nghĩa gì không. Vì vậy, ví dụ: giả sử tôi có số liệu định tính hoặc mô tả và tôi chỉ định "1" nếu số liệu đó hợp lệ cho thứ nguyên đó và "0" nếu không phải là (dữ liệu nhị phân). Vì vậy, ví dụ, giả vờ bạn đang cố gắng so sánh Bảy chú lùn trong Bạch Tuyết. Chúng ta có:
Doc, Dopey, Bashful, Grumpy, Sneezy, Buồn ngủ và Hạnh phúc, và bạn muốn sắp xếp chúng dựa trên phẩm chất, và đã làm như vậy:
Vì vậy, ví dụ Bashful không dung nạp đường sữa và không nằm trong danh dự A. Đây là một ma trận giả định hoàn toàn và ma trận thực của tôi sẽ có nhiều cột mô tả hơn. Câu hỏi của tôi là, liệu PCA trên ma trận này có còn phù hợp để tìm sự tương đồng giữa các cá nhân không?
a means of finding the similarity between individuals
. Nhưng nhiệm vụ này là dành cho phân tích Cluster, không phải PCA.