Thứ nhất, tôi nghĩ rằng khử tương quan và làm trắng là hai thủ tục riêng biệt.
Để khử tương quan dữ liệu, chúng ta cần chuyển đổi nó để dữ liệu được chuyển đổi sẽ có ma trận hiệp phương sai chéo. Biến đổi này có thể được tìm thấy bằng cách giải quyết vấn đề eigenvalue. Chúng tôi tìm ra vector riêng và giá trị riêng liên quan của hiệp phương sai ma trận bởi giải quyếtΣ = X X'
Σ Φ = Φ bước sóng
nơi là một ma trận đường chéo có giá trị riêng như các yếu tố đường chéo của nó.Λ
Ma trận do đó diagonalizes ma trận hiệp phương sai của X . Các cột của Φ là vector riêng của ma trận hiệp phương sai.ΦXΦ
Chúng ta cũng có thể viết hiệp phương sai chéo là:
Φ'Σ Φ = Λ(1)
xtôi
x*tôi= Φ'xtôi(2)
Λ
Λ- 1 / 2Λ Λ- 1 / 2= Tôi
( 1 )
Λ- 1 / 2Φ'Σ Φ bước sóng- 1 / 2= Tôi
x*tôix†tôi
x†tôi= Λ- 1 / 2x*tôi= Λ- 1 / 2Φ'xtôi(3)
x†tôix†tôiE ( x†tôix†tôi') = Tôi
Σ
Và cuối cùng, có một "gotcha" chung mà mọi người nên cẩn thận. Bạn phải cẩn thận khi tính toán các hệ số tỷ lệ trên dữ liệu huấn luyện và sau đó bạn sử dụng các phương trình (2) và (3) để áp dụng các hệ số tỷ lệ tương tự cho dữ liệu thử nghiệm, nếu không bạn có nguy cơ bị quá mức (bạn sẽ sử dụng thông tin từ bộ kiểm tra trong quá trình đào tạo).
Nguồn: http://cifts.media.mit.edu/2010fall/mas622j/whiten.pdf