Điều này đề cập đến phần ngắn 12.1.4 PCA cho dữ liệu chiều cao trong cuốn sách của Giám mục. Tôi có thể thấy rằng phần này có thể hơi khó hiểu, bởi vì Giám mục sẽ qua lại giữa và sử dụng ký hiệu hơi không nhất quán.viui
Phần này nói về mối quan hệ giữa các hàm riêng của ma trận hiệp phương sai và các hàm riêng của ma trận Gram ( trong bối cảnh của PCA). Đặt là một hàm riêng có độ dài đơn vị của :1NX⊤X1NXX⊤vi1NXX⊤
1NXX⊤vi=λivi.
Nếu chúng ta nhân phương trình này với từ bên trái:X⊤
1NX⊤X(X⊤vi)=λi(X⊤vi),
chúng ta thấy rằng là một eigenvector của .X⊤vi1NX⊤X
Tuy nhiên, nó sẽ không có đơn vị chiều dài! Thật vậy, chúng ta hãy tính độ dài của nó:
Vì vậy, độ dài bình phương của bằng với . Do đó, nếu chúng ta muốn chuyển đổi thành một hàm riêng ma trận hiệp phương sai độ dài đơn vị , chúng ta cần chuẩn hóa nó có độ dài đơn vị:
∥X⊤vi∥2=(X⊤vi)⊤X⊤vi=v⊤iXX⊤vi=vi(Nλvi)=Nλ∥vi∥2=Nλi.
X⊤viNλiviuiui=1(Nλi)1/2X⊤vi.
(Xin lưu ý rằng ở trên không sử dụng định nghĩa mà bạn đã trích dẫn. Thay vào đó, chúng tôi đã bắt đầu trực tiếp với một đơn vị độ dài . Tôi tin rằng đây có thể là nguồn gốc của sự nhầm lẫn của bạn. Giám mục sử dụng định nghĩa trước đó trong phần, nhưng nó không còn phù hợp nữa cho đối số cụ thể này.)vi=Xuivivi=Xui