Các mô hình xác suất cho bình phương tối thiểu một phần, giảm hồi quy xếp hạng và phân tích tương quan chính tắc?


7

Câu hỏi này là kết quả của cuộc thảo luận sau câu hỏi trước: Mối liên hệ giữa bình phương nhỏ nhất một phần, hồi quy thứ hạng giảm và hồi quy thành phần chính là gì?

Để phân tích thành phần chính, một mô hình xác suất thường được sử dụng là trong đó z \ sim \ mathcal N (0, 1) , \ mathbf {w} \ in S ^ {p-1} , \ lambda> 0\ boldsymbol \ epsilon \ sim \ mathcal N (0, \ mathbf {I} _p) . Khi đó hiệp phương sai dân số của \ mathbf {x}\ lambda \ mathbf {w} \ mathbf {w} ^ T + \ mathbf {I} _p , tức là \ mathbf {x} \ sim \ mathcal N (0, \ lambda \ mathbf {w} \ mathbf {w} ^ T + \ mathbf {I} _p). Mục tiêu là ước tính \ mathbf {w}

x=λwz+ϵRp,
zN(0,1)wSp1λ>0ϵN(0,Ip)xλwwT+Ip
xN(0,λwwT+Ip).
w. Đây được gọi là mô hình hiệp phương sai, thường được sử dụng trong tài liệu PCA. Vấn đề ước tính đúng w có thể được giải quyết bằng cách tối đa hóa Var(Xw) trên w trên phạm vi đơn vị.

Như @amoeba đã chỉ ra trong câu trả lời cho câu hỏi trước đó , việc giảm hồi quy thứ hạng, bình phương tối thiểu một phần và phân tích tương quan chính tắc có các công thức liên quan chặt chẽ với nhau,

PCA:Var(Xw),RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv),PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv),CCA:Var(Xw)Corr2(Xw,Yv).

Câu hỏi là, các mô hình xác suất đằng sau RRR, PLS và CCA là gì? Cụ thể, tôi đang suy nghĩ vềLàm thế nào phụ thuộc vào và trong RRR, PLS và CCA? Hơn nữa, có một mô hình xác suất thống nhất (như mô hình hiệp phương sai cho PCA) cho họ không?

(xT,yT)TN(0,Σ).
Σwv

Xin chào @Moskowitz. Là câu trả lời của tôi đi theo hướng mà bạn đã hy vọng? Tôi có thể thấy rằng nó không trả lời đầy đủ câu hỏi của bạn, nhưng tôi sẽ rất vui khi nhận được một số phản hồi và cũng quan tâm để biết suy nghĩ của bạn về nó. Tôi có thể mở rộng mô tả về PCCA nếu bạn muốn; "PPLS" không thực sự tồn tại là điều mà tôi đã nghĩ về nó vài năm trước và thấy mình suy nghĩ lại. Vì vậy, sẽ tò mò để nghe suy nghĩ của bạn về nó.
amip

Xin chào @amoeba. Cảm ơn rất nhiều cho câu trả lời. Xin lỗi vì đã ngừng trả lời. Tôi đã suy nghĩ về việc xem PPLS như một mô hình nhiều chế độ xem khác nhau, trong đó hai biến x có phân phối khác nhau, nhưng không thành công lắm. Tôi sẽ cố gắng thêm vào câu trả lời của bạn nếu tôi có thể tìm ra;)
Minkov

Câu trả lời:


6

Phân tích tương quan chính tắc xác suất (CCA xác suất, PCCA) đã được giới thiệu trong Bach & Jordan, 2005, Giải thích xác suất phân tích tương quan Canonical , vài năm sau khi Tipping & Bishop trình bày phân tích thành phần chính xác suất của họ (PCA xác suất, PPCA).

Rất ngắn gọn, nó dựa trên mô hình xác suất sau:

zN(0,I)x|zN(Wxz+μx,Ψx)y|zN(Wyz+μy,Ψy)

Ở đây hiệp phương sai và là các ma trận đối xứng thứ hạng đầy đủ tùy ý.ΨxΨy

Mô hình đồ họa PCCA

Nếu chúng ta xem xét biến tiềm ẩn 1 chiều , giả sử rằng tất cả các phương tiện đều bằng 0 và kết hợp và thành một vectơ, thì chúng ta sẽ nhận được:zμx=μy=0xy

(xy)N(0,Σ),Σ=(wxwx+Ψxwxwywywxwywy+Ψy).

Bach & Jordan đã chứng minh rằng điều này tương đương với CCA tiêu chuẩn. Cụ thể, tối đa khả năng (ML) giải pháp được đưa ra bởi nơi là ma trận hiệp phương sai mẫu của cả hai tập hợp dữ liệu, là cặp kinh điển đầu tiên của trục, và là tùy ý các số (cả từ đến ) đưa ra mối tương quan chính tắc đầu tiên dưới dạng sản phẩm.

wi=Σiuimi,
Σiuimxmy=ρ101

Như bạn thấy, không trực tiếp bằng các trục CCA, nhưng được đưa ra bởi một số biến đổi của chúng. Xem Bach & Jordan để biết thêm chi tiết.wi


Tôi không nắm bắt trực quan tốt về PCCA. Như bạn có thể thấy, ma trận hiệp phương sai giữa và được mô hình hóa bởi , do đó, người ta có thể ngây thơ mong đợi sẽ tạo ra các trục PLS. Tuy nhiên, giải pháp ML có liên quan đến các trục CCA. Có lẽ bằng cách nào đó do cấu trúc khối chéo của .XYwxwywiΨ=(Ψx00Ψy)

Tôi không biết về bất kỳ phiên bản xác suất tương tự nào của RRR hoặc PLS, và đã không tự mình đưa ra bất kỳ phiên bản nào. Lưu ý rằng nếu là đường chéo thì chúng ta thu được FA trên tập dữ liệu kết hợp và nếu đó là đường chéo và đẳng hướng thì chúng ta sẽ có PPCA trên tập dữ liệu kết hợp. Vì vậy, có một sự tiến triển từ CCA sang FA sang PPCA, vì ngày càng bị hạn chế. Tôi không thấy những lựa chọn nào khác của có thể hợp lý.ΨX+YΨΨ


Nói tóm lại: "isotropic" trong câu cuối cùng thứ hai của bạn là gì?
Gottfried Helms

@Gottfried, nó có nghĩa là nó là đường chéo và tất cả các yếu tố trên đường chéo đều bình đẳng, tức là . Tôi sẽ chỉnh sửa để làm rõ. \P=σ2\I
amip

Tôi hiểu rồi, cảm ơn. Tôi đã thực hiện một cấu trúc như vậy trong chương trình pca / yếu tố của tôi mà không biết tên của nó, dựa trên một gợi ý của S. Mulaik trong cuốn sách năm 1972 của ông. Những điều cần biết ...
Gottfried Helms
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.