Tôi biết rằng trong một tình huống hồi quy, nếu bạn có một tập hợp các biến có tương quan cao thì điều này thường là "xấu" vì sự không ổn định trong các hệ số ước tính (phương sai đi về vô cực khi định thức đi về 0).
Câu hỏi của tôi là liệu "tính xấu" này có tồn tại trong tình huống PCA hay không. Các hệ số / tải trọng / trọng số / hàm riêng cho bất kỳ PC cụ thể nào trở nên không ổn định / tùy ý / không duy nhất khi ma trận hiệp phương sai trở thành số ít? Tôi đặc biệt quan tâm đến trường hợp chỉ giữ lại thành phần chính đầu tiên và tất cả các thành phần khác bị loại bỏ là "tiếng ồn" hoặc "thứ gì khác" hoặc "không quan trọng".
Tôi không nghĩ rằng nó như vậy, bởi vì bạn sẽ chỉ còn lại một vài thành phần chính có 0 hoặc gần với phương sai bằng không.
Dễ thấy đây không phải là trường hợp cực kỳ đơn giản với 2 biến - giả sử chúng có mối tương quan hoàn hảo. Sau đó, PC đầu tiên sẽ là mối quan hệ tuyến tính chính xác và PC thứ hai sẽ vuông góc với PC đầu tiên, với tất cả các giá trị PC bằng 0 cho tất cả các quan sát (tức là phương sai bằng 0). Tự hỏi nếu nó chung chung hơn.