Định mức nào của lỗi tái cấu trúc được giảm thiểu bằng ma trận xấp xỉ bậc thấp thu được với PCA?


26

Cho một PCA (hoặc SVD) xấp xỉ của ma trận với một ma trận , chúng ta biết rằng là xấp xỉ hạng thấp nhất của .X X XXX^X^X

Đây có phải là theo gây chuẩn2F (tức là tiêu chuẩn eigenvalue lớn nhất) hoặc theo Frobenius chuẩn mực?F

Câu trả lời:


30

Câu trả lời duy nhất: Cả hai.


Hãy bắt đầu với việc xác định các tiêu chuẩn. Đối với ma trận , toán tử -norm được định nghĩa là và định mức Frobenius là trong đó s_i là các giá trị số ít của X , tức là các phần tử đường chéo của S trong phân tách giá trị số ít X = USV ^ \ top .2 X 2 = s u p X v 2X2XF=

X2=supXv2v2=max(si)
siXSX=USV
XF=ijXij2=tr(XX)=si2,
siXSX=USV

PCA được cung cấp bởi cùng một phân tách giá trị số ít khi dữ liệu được căn giữa. US là các thành phần chính, V là các trục chính, tức là các hàm riêng của ma trận hiệp phương sai và việc xây dựng lại X chỉ với các thành phần chính k tương ứng với các giá trị số ít k lớn nhất được đưa ra bởi Xk=UkSkVk .

Các Eckart-Young lý nói rằng là ma trận giảm thiểu các chỉ tiêu lỗi tái thiếttrong số tất cả các ma trận của bậc . Điều này đúng cho cả hai, định mức Frobenius và toán tử -norm. Như @cardinal đã chỉ ra trong các bình luận, lần đầu tiên nó được chứng minh bởi Schmidt (của danh tiếng Gram-Schmidt) vào năm 1907 cho trường hợp Frobenius. Sau đó, nó đã được Eckart và Young khám phá lại vào năm 1936 và hiện chủ yếu gắn liền với tên của họ. Mirsky đã khái quát định lý vào năm 1958 cho tất cả các định mức bất biến dưới các phép biến đổi đơn vị, và điều này bao gồm toán tử 2 định mức.X - A A k 2XkXAAk2

Định lý này đôi khi được gọi là định lý Eckart-Young-Mirsky. Stewart (1993) gọi đó là định lý gần đúng của Schmidt. Tôi thậm chí đã nhìn thấy nó được gọi là định lý Schmidt-Eckart-Young-Mirsky.


Bằng chứng cho toán tử -norm2

Đặt là hạng đầy đủ . Vì là hạng , không gian null của nó có kích thước . Không gian được kéo dài bởi các vectơ số đơn bên phải của tương ứng với các giá trị số ít lớn nhất có kích thước. Vậy hai không gian này phải giao nhau. Đặt là một vectơ đơn vị từ giao điểm. Sau đó, chúng tôi nhận được: QED.n A k n - k k + 1 X k + 1 wXnAknkk+1Xk+1w

X-Một22(X-Một)w22= =Xw22= =Σtôi= =1k+1Stôi2(vtôiw)2Sk+12= =X-Xk22,

Bằng chứng cho định mức Frobenius

Chúng tôi muốn tìm ma trận của hạng giảm thiểu . Chúng ta có thể xác định , trong đó có cột trực giao. Giảm thiểu cho cố định là một vấn đề hồi quy với giải pháp . Cắm nó vào, chúng tôi thấy rằng bây giờ chúng tôi cần giảm thiểu Trong đó là ma trận hiệp phương sai của , tức làk X -Mộtk Một = B W W k X - B W 2 W B = X W X - X W W 2 = X 2 - X W W 2 = c o n s t - t r (X-MộtF2Một= =BWWkX-BW2WB= =XWΣ X Σ = X X / ( n - 1 ) W k

X-XWW2= =X2-XWW2= =conSt-tr(WWXXWW)= =conSt-conSttr(WΣW),
ΣXΣ= =XX/(n-1). Điều này có nghĩa là lỗi tái cấu trúc được giảm thiểu bằng cách lấy các cột của một số vectơ trực giao tối đa hóa tổng phương sai của hình chiếu.Wk

Người ta biết rằng đây là những hàm riêng đầu tiên của ma trận hiệp phương sai. Thật vậy, nếu , thì . Viết cũng có các cột trực giao, chúng tôi nhận được với mức tối đa đạt được khi . Định lý sau đó ngay lập tức.X = U S V kX= =BạnSV R = V W t r ( W Σ W ) = t r ( R Λ R ) = Σ i λ i Σ j R 2 i jk ΣΣ= =VS2V/(n-1)= =VΛVR= =VWW=Vk

tr(WΣW)= =tr(RΛR)= =ΣtôiλtôiΣjRtôij2Σtôi= =1kλk,
W= =Vk

Xem ba chủ đề liên quan sau đây:


Nỗ lực trước đây của một bằng chứng cho định mức Frobenius

Bằng chứng này tôi tìm thấy ở đâu đó trực tuyến nhưng nó sai (chứa một khoảng trống), như được giải thích bởi @cardinal trong các bình luận.

Định mức Frobenius là bất biến dưới các phép biến đổi đơn vị, bởi vì chúng không thay đổi các giá trị số ít. Vậy ta nhận được: trong đó . Tiếp tục:Điều này được giảm thiểu khi tất cả các phần tử nằm ngoài đường chéo của bằng 0 và tất cả các điều khoản đường chéo hủy bỏ các giá trị số ít lớn nhất [khoảng cách ở đây: điều này không rõ ràng] , tức là và do đó .

X-MộtF= =BạnSV-Một= =S-BạnMộtV= =S-B,
B= =BạnMộtV
X-MộtF= =Σtôij(Stôij-Btôij)2= =Σtôi(Stôi-Btôitôi)2+ΣtôijBtôij2.
BkkStôi Bopttôimmộttôi= =SkMộtopttôimmộttôi= =BạnkSkVk

2
Bằng chứng trong trường hợp định mức Frobeniius là không chính xác (hoặc ít nhất là hoàn chỉnh) vì lập luận ở đây không loại trừ khả năng một ma trận có cùng thứ hạng có thể loại bỏ một số thuật ngữ đường chéo khác trong khi có "nhỏ" đường chéo. Để thấy khoảng cách rõ ràng hơn, lưu ý rằng việc giữ các đường chéo không đổi và "zeroing" các đường chéo thường có thể tăng thứ hạng của ma trận trong câu hỏi!
hồng y

1
Cũng lưu ý rằng SVD đã được biết đến với Beltrami (ít nhất là trong một trường hợp khá chung, mặc dù trường hợp đặc biệt) và Jordan sớm nhất là vào năm 1874.
hồng y

@cardinal: Hmmmm, tôi không chắc là tôi thấy khoảng trống. Nếu hủy bỏ một số thuật ngữ đường chéo khác trong thay vì lớn nhất và có một số thuật ngữ khác không thay thế, thì cả hai tổng, và , sẽ tăng lên. Vì vậy, nó sẽ chỉ làm tăng lỗi tái thiết. Không? Tuy nhiên, tôi đã cố gắng tìm một bằng chứng khác cho định mức Frobenius trong tài liệu, và đã đọc rằng nó nên bằng cách nào đó dễ dàng tuân theo trường hợp định mức toán tử. Nhưng cho đến nay tôi không thấy nó nên theo dõi như thế nào ...BSkΣtôi(Stôi-Btôitôi)2ΣtôijBtôij2
amip nói rằng Rebstate Monica

3
Tôi làm như GW Stewart (1993), Trên lịch sử đầu tiên của quá trình phân hủy giá trị độc nhất vô nhị SIAM xét , vol. 35, không 4, 551-566 và, trước sự quan tâm đã được chứng minh trước đó của bạn về các vấn đề lịch sử, tôi nghĩ bạn cũng sẽ như vậy. Thật không may, tôi nghĩ rằng Stewart đã vô tình gạt bỏ quá mức sự thanh lịch của bằng chứng năm 1907 của Schmidt. Ẩn bên trong nó là một diễn giải hồi quy mà Stewart bỏ qua và nó thực sự khá đẹp. Có một bằng chứng khác theo cách tiếp cận đường chéo ban đầu mà bạn thực hiện, nhưng đòi hỏi một số công việc bổ sung để lấp đầy khoảng trống. (tt)
hồng y

2
@cardinal: Vâng, bạn nói đúng, giờ tôi cũng thấy khoảng trống. Cảm ơn rất nhiều cho bài báo Stewart, đó là một bài đọc rất thú vị. Tôi thấy rằng Stewart đưa ra bằng chứng của Schmidt và Weyl, nhưng cả hai đều trông phức tạp hơn những gì tôi muốn sao chép ở đây (và cho đến nay tôi không có thời gian để nghiên cứu chúng một cách cẩn thận). Tôi ngạc nhiên: Tôi mong đợi đây là một kết quả rất đơn giản, nhưng có vẻ như nó ít tầm thường hơn tôi nghĩ. Cụ thể, tôi không ngờ rằng trường hợp Frobenius lại phức tạp hơn nhiều so với quy tắc vận hành. Tôi sẽ chỉnh sửa bài viết bây giờ. Chúc mừng năm mới!
amip nói rằng Phục hồi lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.