Hãy để bạn (trung tâm) dữ liệu được lưu trữ trong một ma trận X với d tính năng (biến) trong các cột và n điểm dữ liệu trong hàng. Hãy để cho ma trận hiệp phương sai C = X ⊤ X / n có vector riêng trong cột E và giá trị riêng trên đường chéo của D , do đó C = E D E ⊤ .viết sai rồi × dXCười mở miệngviết sai rồiC = X⊤X / nECƯỜI MỞ MIỆNGC = E D E⊤
Sau đó, những gì bạn gọi là "bình thường" chuyển đổi làm trắng PCA được cho bởi , xem ví dụ câu trả lời của tôi trong Làm thế nào để làm trắng các dữ liệu sử dụng phép phân tích thành phần chính?WP C A= = D- 1 / 2E⊤
Tuy nhiên, sự chuyển đổi làm trắng này không phải là duy nhất. Thật vậy, dữ liệu được làm trắng sẽ được giữ trắng sau bất kỳ phép quay nào, điều đó có nghĩa là bất kỳ với ma trận trực giao R cũng sẽ là một phép biến đổi làm trắng. Trong những gì được gọi ZCA làm trắng, chúng ta lấy E (xếp chồng lên nhau cùng vector riêng của ma trận hiệp phương sai) như ma trận trực giao này, tức là W Z C Một = E D - 1 / 2 E ⊤ = C - 1 / 2 .W = R WP C ARE
WZ C A= E D- 1 / 2E⊤= C- 1 / 2.
Một thuộc tính xác định của chuyển đổi ZCA ( đôi khi còn được gọi là "chuyển đổi Mahalanobis") là nó dẫn đến dữ liệu trắng gần với dữ liệu gốc nhất (theo nghĩa bình phương nhỏ nhất). Nói cách khác, nếu bạn muốn giảm thiểu tùy thuộc vào X Một ⊤ được làm trắng, sau đó bạn nên tham gia một = W Z C Một . Đây là một minh họa 2D:∥ X - X A⊤∥2X A⊤A = WZ C A
WP C AWZ C AE.
Thuật ngữ "ZCA" dường như đã được giới thiệu trong Bell và Sejnowski 1996trong bối cảnh phân tích thành phần độc lập và là viết tắt của "phân tích thành phần không pha". Xem ở đó để biết thêm chi tiết. Rất có thể, bạn đã gặp thuật ngữ này trong bối cảnh xử lý hình ảnh. Hóa ra, khi được áp dụng cho một loạt các hình ảnh tự nhiên (pixel là các tính năng, mỗi hình ảnh như một điểm dữ liệu), các trục chính trông giống như các thành phần Fourier có tần số tăng dần, xem cột đầu tiên của Hình 1 bên dưới. Vì vậy, họ rất "toàn cầu". Mặt khác, các hàng chuyển đổi ZCA trông rất "cục bộ", xem cột thứ hai. Điều này là chính xác bởi vì ZCA cố gắng chuyển đổi dữ liệu ít nhất có thể và do đó, mỗi hàng tốt hơn nên gần với một hàm cơ sở ban đầu (sẽ là hình ảnh chỉ có một pixel hoạt động). Và điều này có thể đạt được,
Cập nhật
Các ví dụ khác về bộ lọc ZCA và hình ảnh được chuyển đổi bằng ZCA được đưa ra trong Krizhevsky, 2009, Học nhiều lớp tính năng từ hình ảnh nhỏ , xem thêm ví dụ trong câu trả lời của @ bayerj (+1).
Tôi nghĩ những ví dụ này đưa ra ý tưởng về việc làm trắng ZCA có thể thích hợp hơn với PCA. Cụ thể, hình ảnh được làm trắng ZCA vẫn giống với hình ảnh bình thường , trong khi hình ảnh được làm trắng bằng PCA trông không giống hình ảnh bình thường. Điều này có lẽ rất quan trọng đối với các thuật toán như mạng nơ ron tích chập (ví dụ như được sử dụng trong bài báo của Krizhevsky), xử lý các pixel lân cận với nhau và phụ thuộc rất nhiều vào các thuộc tính cục bộ của hình ảnh tự nhiên. Đối với hầu hết các thuật toán học máy khác, nó hoàn toàn không liên quan cho dù dữ liệu được làm trắng bằng PCA hay ZCA.