Tại sao các eigenvector PCA trực giao và mối quan hệ với điểm số PCA là không tương quan?


8

Tôi đang đọc trên PCA, và tôi hiểu hầu hết những gì đang diễn ra về mặt phái sinh ngoài giả định rằng người bản địa cần phải trực giao và làm thế nào nó liên quan đến các dự đoán (điểm PCA) không được thông báo? Tôi có hai cách giải thích được cung cấp dưới đây sử dụng một liên kết giữa tính trực giao và tương quan nhưng không thực sự giải thích nó: MỘT , HAI .

Trong bức ảnh thứ hai, nó nói rằng điều kiện được áp đặt để đảm bảo rằng phép chiếu sẽ không tương thích với . Ai đó có thể cung cấp một ví dụ để chỉ ra lý do tại sao các vectơ trực giao đảm bảo các biến không tương quan?a2Ta1=0y2=Xa2y1=Xa1

Điều gì sẽ xảy ra trong PCA nếu tôi chọn các vectơ không trực giao; điều này thậm chí có thể? Tôi đã đọc ở nơi khác rằng tính trực giao chỉ là sản phẩm phụ của ma trận hiệp phương sai đối xứng, điều đó cho thấy rằng không thể có các hàm sinh riêng trực giao không theo cặp. Tuy nhiên, trong bức tranh đầu tiên trong tìm kiếm của ma trận nhất 'phù hợp' nó gần như có vẻ như chúng ta đang lựa chọn là trực giao để cung cấp cho chúng ta một ma trận thuận tiện hơn một trong đó có tính chất tốt đẹp.p1,,pmP

Tôi đã đọc các bài viết khác về chủ đề này nhưng không hài lòng với việc kết hợp trực giác với các biến không tương quan. Tôi thực sự đánh giá cao bất kỳ sự giúp đỡ trong việc hiểu sự nhầm lẫn này !!


Tích số của các vectơ trung tâm luôn tỷ lệ thuận với hiệp phương sai của chúng, đến lượt nó tỷ lệ thuận với mối tương quan của chúng. Điều này là ngay lập tức: các công thức cho cả ba đều giống nhau đến một hằng số khác không. Do đó, một là 0 khi và chỉ khi bất kỳ ai khác bằng không.
whuber

@whuber Tôi nghĩ rằng bạn đã hiểu nhầm câu hỏi: OP đang hỏi làm thế nào tính trực giao của các hàm riêng của PCA ngụ ý không tương quan của các phép chiếu dữ liệu lên các hàm riêng này.
amip

@Amoeba Tôi sợ điều đó làm tôi hoang mang hơn nữa. Nếu các vectơ là trực giao, thì một fortiori bất kỳ hình chiếu nào trên các vectơ đó phải là trực giao. Câu hỏi tôi đã trả lời là "ai đó có thể cung cấp một ví dụ để cho thấy tại sao các vectơ trực giao đảm bảo các biến không tương quan." Điều đó dường như vẫn hỏi tại sao tính trực giao ngụ ý thiếu sự tương quan.
whuber

@whuber Ý bạn là gì "Nếu các vectơ là trực giao, thì một fortiori bất kỳ hình chiếu nào trên các vectơ đó phải là trực giao"? Có một số hiểu lầm ở đây. Lấy bất kỳ dữ liệu bivariate với tương quan khác không. Các vectơ [0,1] và [1,0] (vectơ cơ sở) là trực giao, nhưng các phép chiếu dữ liệu lên các vectơ này có mối tương quan với nhau.
amip

@Amoeba Tôi chắc chắn bạn đã đúng và tôi cũng chắc chắn rằng chúng ta có hai cách hiểu khác nhau về những gì bạn đang nói! Nếu bạn chiếu một vectơ lên một vectơ và một vectơ lên và và là trực giao, thì các hình chiếu cũng sẽ trực giao. Nếu thay vào đó, bạn chiếu lên không gian vectơ được tạo bởi thì tất nhiên các phép chiếu không cần phải trực giao. Những điều tầm thường này không đáng để thảo luận: mối quan tâm đầu tiên của chúng ta là làm rõ câu hỏi thực sự đang hỏi là gì. p1vp2wvwpi{v,w}
whuber

Câu trả lời:


9

Tôi sẽ cố gắng để giải thích cách thức trực giao của và Đảm bảo rằng và được không tương quan. Chúng tôi muốn để tối đa hóa . Điều này sẽ không đạt được trừ khi chúng ta giới hạn , trong trường hợp này là . Tối ưu hóa này yêu cầu sử dụng Hệ số nhân Lagrange (không quá phức tạp, hãy đọc về nó trên Wikipedia). Do đó, chúng tôi cố gắng tối đa hóa đối với cả và . Lưu ý rằng sự khác biệt đối vớia1a2y1y2a1Var(y1)=a1TΣa1a1a1Ta1=1

a1TΣa1λ(a1Ta11)
a1λλvà sau đó tương đương với đưa ra ràng buộc của chúng tôi . Sự khác biệt đối với mang lại cho hoặc phương sai của sẽ được tối đa hóa bởi giá trị riêng lớn nhất . Do đó . Đây là phần sẽ trả lời câu hỏi của bạn . Một số tính toán cơ bản sử dụng định nghĩa hiệp phương sai sẽ cho thấy 0a1Ta1=1a1
Σa1λa1=0
(ΣλIp)a1=0
y1λ1λ1a1=Σa1
Cov(y1,y2)=Cov(a1Tx,a2Tx)=a1TΣa2=a2TΣa1=a2Tλ1a1=λ1a2Ta1
sẽ bằng khi và chỉ khi .0một2Tmột1= =0

4

PCA hoạt động bằng cách tính toán các hàm riêng của ma trận hiệp phương sai của dữ liệu. Nghĩa là, các hàm riêng đó tương ứng với các lựa chọn của nhằm tối đa hóa các phương trình và đáp ứng các ràng buộc được đưa ra trong cuốn sách của bạn. Nếu bạn chọn các vectơ khác nhau, chúng sẽ không phù hợp với tất cả các tiêu chí đó và nó sẽ không còn là PCA nữa (bạn vẫn sẽ tìm thấy một số "thành phần" nhưng chúng sẽ không còn là "hiệu trưởng").một1:M

Eigenvector có thể được tính toán từ bất kỳ ma trận vuông nào và không phải trực giao. Tuy nhiên, vì bất kỳ ma trận hiệp phương sai thích hợp nào cũng là đối xứng và ma trận đối xứng có các hàm riêng trực giao, PCA luôn dẫn đến các thành phần trực giao.

Tính trực giao của và không tuân theo yêu cầu - nó tuân theo tất cả các ràng buộc cùng nhau. Thật dễ dàng để xem lý do tại sao trực giao của và là không đủ, bởi vì nền tảng ban đầu trong đó các dữ liệu được thể hiện cũng là trực giao. Ví dụ: ở 2 chiều, bạn sẽ có và và rõ ràng dữ liệu của bạn không phải không tương thích với các kích thước đó (nếu có, PCA của bạn sẽ trả về cơ sở ban đầu, cho đến một hệ số tỷ lệ).y1y2một1Tmột2= =0một1một2bb1= =[10]b2= =[01]

Văn bản được diễn đạt một chút vụng về, nhưng tôi nghĩ "cái" trong "đảm bảo ..." đề cập đến toàn bộ mệnh đề đi trước.


Cảm ơn bài đăng tuyệt vời, tôi nghĩ để tôi hiểu đầy đủ về nó, bạn có thể giải thích hai điểm, 1. Làm thế nào các điều kiện đảm bảo tính trực giao của và và 2. tính trực giao sau đó dẫn đến các biến như thế nào bị thất vọng? Có thể bằng một bằng chứng hoặc một ví dụ? y1y2
Pavan Sangha
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.