Như đã đề cập trong câu trả lời trước, có một số phương pháp giảm kích thước và một điều quan trọng cần xem xét là bạn đang cố gắng thể hiện điều gì - bạn có quan tâm đến các biện pháp khoảng cách Euclide không? Hoặc một số liệu tương tự trên các mẫu?
Đối với trước đây, PCA có thể thích hợp. Nó thường được sử dụng với các biện pháp liên tục như đo mẫu (động vật, thực vật, v.v ...). Tôi cũng sẽ xem xét các đề cập hiện đại hơn trong câu trả lời trước đó.
Đối với trường hợp sau, trong đó bạn có thể đang cố gắng so sánh độ tương tự bằng cách sử dụng thước đo khoảng cách phi hạt nhân, một vài phương pháp tốt tồn tại như Nguyên tắc phổ biến thành phần nguyên tắc (PCoA) và Thang đo đa chiều không đo (NMDS). Một ví dụ về thời điểm bạn có thể sử dụng những thứ này là khi bạn so sánh các cộng đồng sinh thái giữa các khu vực khác nhau và bạn có số lượng các loại sinh vật khác nhau được tìm thấy. Vì vậy, dữ liệu của bạn là dữ liệu "đếm". Có một số số liệu tương tự như Jaccard, Sorensen, Bray-Curtis, cho phép bạn ước tính mức độ tương tự của các trang web trong thành phần sinh vật của chúng. PCoA và NMDS về cơ bản cho phép bạn vẽ các mẫu (trang web) để biểu thị khoảng cách sinh thái (độ tương tự) và bạn có điểm cho trang web trên mỗi trục.
Có rất nhiều sách hay và các tài nguyên khác để phân tích đa biến. Tìm kiếm "Phổ biến" trên Google. Ngoài ra, có một gói R được gọi là "thuần chay" thực sự tốt cho việc thực hiện rất nhiều công việc này.