Đọc Wikipedia về phân tích tương quan chính tắc (CCA) cho hai vectơ ngẫu nhiên và , tôi đã tự hỏi liệu thành phần chính anslysis (PCA) có giống với CCA khi không?Y X = Y
Đọc Wikipedia về phân tích tương quan chính tắc (CCA) cho hai vectơ ngẫu nhiên và , tôi đã tự hỏi liệu thành phần chính anslysis (PCA) có giống với CCA khi không?Y X = Y
Câu trả lời:
Đặt là n × p 1 và Y là ma trận dữ liệu n × p 2 , đại diện cho hai bộ dữ liệu với n mẫu (tức là quan sát các vectơ hàng ngẫu nhiên X và Y ) của chúng trong mỗi chúng.
CCA tìm kiếm sự kết hợp tuyến tính của các biến trong X và kết hợp tuyến tính của các biến p 2 trong Y sao cho chúng có mối tương quan tối đa với nhau; sau đó nó tìm kiếm cặp tiếp theo, trong một ràng buộc không tương quan với cặp đầu tiên; Vân vân.
Trong trường hợp (và p 1 = p 2 = p ), mọi kết hợp tuyến tính trong một tập dữ liệu sẽ có tương quan 1 với kết hợp tuyến tính tương tự trong một tập dữ liệu khác. Vì vậy, tất cả các cặp CCA sẽ có tương quan 1 và thứ tự các cặp là tùy ý. Hạn chế duy nhất còn lại là các kết hợp tuyến tính nên không tương quan với nhau. Có vô số cách để chọn p kết hợp tuyến tính không tương quan (lưu ý rằng các trọng số không phải là trực giao trong pkhông gian hai chiều) và bất kỳ trong số họ sẽ tạo ra một giải pháp CCA hợp lệ. Một cách như vậy thực sự được đưa ra bởi PCA, vì bất kỳ hai PC nào cũng có tương quan bằng không.
Vì vậy, giải pháp PCA thực sự sẽ là một giải pháp CCA hợp lệ, nhưng có vô số giải pháp CCA tốt tương đương trong trường hợp này.
vectors X and Y
Có phải hai biến (cột dữ liệu) hoặc hai trường hợp (hàng); cho rằng chúng ta sẽ thực hiện các phân tích về các biến. 2)X and Y are the same
Bạn có muốn nói rằng X = Y hoặc bất kỳ cách nào khác không?