Là CCA giữa hai bộ dữ liệu giống hệt nhau tương đương với PCA trên bộ dữ liệu này?


9

Đọc Wikipedia về phân tích tương quan chính tắc (CCA) cho hai vectơ ngẫu nhiên và , tôi đã tự hỏi liệu thành phần chính anslysis (PCA) có giống với CCA khi không?Y X = YXYX=Y


Vui lòng làm rõ hơn: 1) vectors X and YCó phải hai biến (cột dữ liệu) hoặc hai trường hợp (hàng); cho rằng chúng ta sẽ thực hiện các phân tích về các biến. 2) X and Y are the sameBạn có muốn nói rằng X = Y hoặc bất kỳ cách nào khác không?
ttnphns

@ttnphns: 1) Y là hai vectơ ngẫu nhiên. Chúng là hai vectơ của các biến ngẫu nhiên, hai bộ cột dữ liệu, không phải hai trường hợp (hàng). 2) X = Y . XYX= =Y
Tim

Nếu mỗi bộ bao gồm một biến duy nhất, có một mối tương quan chính tắc chính xác là Pearson r giữa chúng; và CCA trở thành hồi quy tuyến tính của X theo Y và ngược lại. Sự phân rã của r đó bằng PCA là một câu chuyện khác. PCA và CCA là những phân tích khác nhau.
ttnphns

Xin chào, @Tim, tôi tự hỏi liệu câu trả lời của tôi có hữu ích không hoặc liệu bạn có còn câu hỏi nào nữa không? Nếu vậy, tôi sẽ vui lòng làm rõ.
amip

@amoeba: Vâng, đúng vậy. Tôi không có thêm câu hỏi ngay bây giờ, và sẽ đọc câu trả lời của bạn sau. Cảm ơn câu trả lời của bạn. + 1
Tim

Câu trả lời:


6

Đặt n × p 1Y là ma trận dữ liệu n × p 2 , đại diện cho hai bộ dữ liệu với n mẫu (tức là quan sát các vectơ hàng ngẫu nhiên XY ) của chúng trong mỗi chúng.Xn×p1Yn×p2nXY

CCA tìm kiếm sự kết hợp tuyến tính của các biến trong X và kết hợp tuyến tính của các biến p 2 trong Y sao cho chúng có mối tương quan tối đa với nhau; sau đó nó tìm kiếm cặp tiếp theo, trong một ràng buộc không tương quan với cặp đầu tiên; Vân vân.p1Xp2Y

Trong trường hợp (và p 1 = p 2 = p ), mọi kết hợp tuyến tính trong một tập dữ liệu sẽ có tương quan 1 với kết hợp tuyến tính tương tự trong một tập dữ liệu khác. Vì vậy, tất cả các cặp CCA sẽ có tương quan 1 và thứ tự các cặp là tùy ý. Hạn chế duy nhất còn lại là các kết hợp tuyến tính nên không tương quan với nhau. Có vô số cách để chọn p kết hợp tuyến tính không tương quan (lưu ý rằng các trọng số không phải là trực giao trong pX= =Yp1= =p2= =p11ppkhông gian hai chiều) và bất kỳ trong số họ sẽ tạo ra một giải pháp CCA hợp lệ. Một cách như vậy thực sự được đưa ra bởi PCA, vì bất kỳ hai PC nào cũng có tương quan bằng không.

Vì vậy, giải pháp PCA thực sự sẽ là một giải pháp CCA hợp lệ, nhưng có vô số giải pháp CCA tốt tương đương trong trường hợp này.


mộtbCXX-1/2CXYCYY-1/2Tôimột= =bCXX-1/2mộtCYY-1/2bCXX-1/2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.