Nếu kích thước mẫu của bạn nhỏ hơn chiều không gian vectơ, ma trận số ít có thể phát sinh. Nếu bạn có ít mẫu hơn (khi là chiều của bạn), tình huống này thậm chí sẽ phát sinh: các mẫu kéo dài tối đa một siêu phẳng chiều. Cho một mẫu nhỏ như vậy, rõ ràng bạn không thể tính được phương sai trong không gian trực giao.d+1dk+1d
Đây là lý do tại sao nó thường không sử dụng PCA theo nghĩa đen, nhưng thay vì thực hiện phân hủy giá trị đặc biệt , có thể được sử dụng để tính toán pseudoinverse của một ma trận. Nếu ma trận khả nghịch, pseudoinverse sẽ là nghịch đảo.
Tuy nhiên, nếu bạn đang nhìn thấy các ma trận không thể đảo ngược, rất có thể khoảng cách của bạn với cụm sẽ vô nghĩa nếu vectơ nằm ngoài siêu phẳng, các cụm lặp lại, bởi vì bạn không biết phương sai trong không gian trực giao (bạn có thể nghĩ về phương sai này là 0!) SVD có thể tính toán giả, nhưng "phương sai" sẽ vẫn không được xác định bởi dữ liệu của bạn.
Trong trường hợp này, có lẽ bạn nên thực hiện giảm kích thước toàn cầu trước tiên. Việc tăng kích thước mẫu sẽ chỉ giúp ích khi bạn thực sự có kích thước không dư thừa: cho dù bạn có vẽ bao nhiêu mẫu từ một bản phân phối với , ma trận sẽ luôn không thể đảo ngược và bạn sẽ không thể phán đoán độ lệch đối với độ lệch chuẩn (bằng 0).y=xx−y
Hơn nữa, tùy thuộc vào cách bạn tính toán ma trận hiệp phương sai, bạn có thể gặp phải các vấn đề về số do hủy bỏ thảm khốc. Cách giải quyết đơn giản nhất là luôn luôn căn giữa dữ liệu trước, để có nghĩa là không.