PCA là CCA như ICA là gì?


8

PCA tìm kiếm các yếu tố trong dữ liệu tối đa hóa phương sai được giải thích. Theo phân tích tương quan Canonical (CCA), theo như tôi hiểu, giống như một PCA nhưng tìm kiếm một yếu tố tối đa hóa hiệp phương sai giữa hai bộ dữ liệu. Vì vậy, tìm pca như các yếu tố, đó là phổ biến cho hai bộ dữ liệu.

Phân tích thành phần độc lập (ICA) là simillar cho PCA, nhưng nó tìm kiếm các yếu tố độc lập thống kê. Mà kết quả là, theo một cách nào đó, các yếu tố dễ hiểu hơn. Ví dụ như con đường gen, mạng lưới não, các bộ phận của khuôn mặt. Hoặc bạn có thể nói nó sẽ xác định các nguồn độc lập được trộn lẫn để tạo ra dữ liệu.

Có một phương pháp, tương tự như ICA, như PCA là CCA không? Vì vậy, sẽ tìm thấy các thành phần độc lập phổ biến cho hai bộ dữ liệu? Kết quả sẽ thực sự có ý nghĩa?


3
PCA vs CCA được giải thích, ví dụ ở đây thống kê.stackexchange.com / q / 65692/3277 . Tôi không nghĩ những gì CCA đưa ra là hợp lý để gọi "các yếu tố".
ttnphns

Câu trả lời:


2

Bước đầu tiên của ICA là sử dụng PCA và chiếu bộ dữ liệu vào một không gian tiềm ẩn chiều thấp. Bước thứ hai là thực hiện thay đổi tọa độ trong không gian tiềm ẩn, được chọn để tối ưu hóa một số đo độ không gaussianity. Điều này có xu hướng dẫn đến các hệ số và tải trọng, nếu không thưa thớt, thì ít nhất là tập trung trong một số lượng nhỏ các quan sát và tính năng, và theo đó nó tạo điều kiện cho việc giải thích.

Tương tự, trong bài viết này về CCA + ICA (Sui et al., "Một mô hình dựa trên CCA + ICA cho phản ứng tổng hợp dữ liệu hình ảnh não đa tác vụ và ứng dụng của nó vào bệnh tâm thần phân liệt"), bước đầu tiên (xem chú thích) là thực hiện CCA, trong đó mang lại một phép chiếu của mỗi tập dữ liệu vào một không gian chiều thấp. Nếu các bộ dữ liệu đầu vào làX1X2, mỗi với N hàng = quan sát, sau đó CCA mang lại Z1=X1W1Z2=X2W2 nơi Ycũng có Nhàng = quan sát. Lưu ý rằngYCó một số lượng nhỏ các cột, được ghép nối giữa Y1Y2, trái ngược với X, s, thậm chí có thể không có cùng số lượng cột. Sau đó, các tác giả áp dụng chiến lược thay đổi tọa độ tương tự như được sử dụng trong ICA, nhưng họ áp dụng nó cho ma trận nối[Z1|Z2].

Lưu ý: các tác giả cũng sử dụng các bước tiền xử lý liên quan đến PCA, mà tôi bỏ qua ở đây. Chúng là một phần của các lựa chọn phân tích cụ thể theo miền của bài báo, thay vì cần thiết cho phương pháp CCA + ICA.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.