Phân tích tương quan Canonical với tương quan xếp hạng


15

Phân tích tương quan Canonical (CCA) nhằm mục đích tối đa hóa tương quan thời điểm sản phẩm Pearson thông thường (tức là hệ số tương quan tuyến tính) của các kết hợp tuyến tính của hai bộ dữ liệu.

Bây giờ, hãy xem xét thực tế là hệ số tương quan này chỉ biện pháp tuyến tính hiệp hội - đây là lý do tại sao chúng ta rất cũng sử dụng, ví dụ, Spearman- hoặc Kendall- τ kết nối (cấp bậc) hệ số tương quan mà đo đơn điệu tùy ý (không nhất thiết là tuyến tính) giữa biến.ρτ

Do đó, tôi đã nghĩ đến những điều sau đây: một hạn chế của CCA là nó chỉ cố gắng nắm bắt sự liên kết tuyến tính giữa các tổ hợp tuyến tính được hình thành do chức năng mục tiêu của nó. Nó sẽ không thể thực hiện để mở rộng CCA trong một nghĩa nào đó bằng cách phát huy tối đa, nói, Spearman- thay vì Pearson- r ?ρr

Thủ tục như vậy sẽ dẫn đến bất cứ điều gì có thể giải thích thống kê và có ý nghĩa? (Liệu nó có ý nghĩa - ví dụ - để thực hiện CCA trên các cấp bậc ...?) Tôi tự hỏi liệu nó có giúp ích gì khi chúng ta xử lý dữ liệu không bình thường ...


4
Sẽ OVERALS - phân tích tuyến tính kinh điển mà tối ưu quy mô (biến đổi đơn điệu) biến để tối đa hóa sự tương quan kinh điển - có thể theo ý thích của bạn?
ttnphns

@ttnphns: Cảm ơn vì ý tưởng này, tôi chưa từng nghe về nó trước đây và trông thực sự thú vị! Tuy nhiên, tôi không nghĩ rằng nó giải quyết được vấn đề: theo như tôi hiểu, về cơ bản nó là sự kết hợp giữa tỷ lệ tối ưu và CCA - nhưng tỷ lệ tối ưu chỉ thực sự có ý nghĩa đối với các biến phân loại. Nó dường như không thay đổi nhiều đối với các biến liên tục được đo theo tỷ lệ (mà tôi có trong tâm trí!). Nhưng hãy sửa tôi, nếu tôi sai.
Tamas Ferenci

1
@ttnphns: Vâng, giống như cách bạn đôi khi sử dụng tương quan Spearman trên các biến liên tục! (Tất nhiên nó xử lý dữ liệu là thông thường ... nhưng chúng tôi không bao giờ sử dụng nó trên các biến liên tục chắc chắn để mô tả mối liên hệ đơn điệu chung (và không chỉ tuyến tính) giữa các biến.) Đó là lý do tại sao tôi nghĩ điều này cũng có ý nghĩa trong CCA ...
Tamas Ferenci

@Glen_b, Bạn nói đúng. Tất nhiên các mối tương quan xếp hạng là cho bất kỳ sự đơn điệu - có thể là dữ liệu thứ tự hoặc liên tục. Tôi rất ngạc nhiên với nhận xét của riêng tôi ở trên rằng tôi đang xóa nó.
ttnphns

Bạn có thể thử sử dụng Kernel CCA, đặc biệt khi được sử dụng với các hàm cơ sở xuyên tâm cho phép chúng tôi chiếu dữ liệu vào không gian con chiều vô hạn.
roni

Câu trả lời:


6

Tôi đã sử dụng mở rộng spline khối bị hạn chế khi tính toán các biến thiên kinh điển. Bạn đang thêm các hàm cơ sở phi tuyến vào phân tích chính xác như bạn sẽ thêm các tính năng mới. Điều này dẫn đến phân tích thành phần chính phi tuyến. Xem chức năng của Hmiscgói R transcanđể biết ví dụ. homalsGói R có điều này hơn nữa.


1
Cảm ơn bạn! Cách tiếp cận được mô tả trong homals là tiểu thuyết đối với tôi, nhưng chắc chắn thú vị.
Tamas Ferenci

4

Phương pháp chuẩn của CCA hoạt động với ma trận hệ số tương quan thời điểm sản phẩm. Đối với CC nhận thức lớn nhất, nó xây dựng hai biến tổng hợp z1 (n) và z2 (n) bằng cách kết hợp tuyến tính của hai ma trận (với n hàng và biến m1 và m2) sao cho abs (tương quan (z1, z2)) được tối đa hóa. Hàm mục tiêu này có thể được tối đa hóa trực tiếp ngay cả khi tương quan (z1, z2) không phải là thời điểm sản phẩm nhưng được định nghĩa khác nhau.

Mishra, SK (2009) "Lưu ý về phân tích tương quan Canonical thông thường của hai bộ điểm xếp hạng"

http: // Vogue.ssrn.com/sol3/ con.cfm? abauge_id = 1328319

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.