Tại sao dấu vết của là trong hồi quy bình phương nhỏ nhất khi vectơ tham số có kích thước p?


13

Trong mô hình , chúng tôi có thể ước tính bằng phương trình bình thường.y=Xβ+ϵβ

y =X β .

β^=(XX)1Xy,
và chúng tôi có thể nhận được
y^=Xβ^.

Vectơ của phần dư được ước tính bởi

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

trong đó

Q=IX(XX)1X.

Câu hỏi của tôi là làm thế nào để có được kết luận của

tr(Q)=np.

Câu trả lời:


12

Kết luận chỉ đơn thuần là đếm kích thước của không gian vectơ. Tuy nhiên, nó không phải là nói chung.

Các tính chất cơ bản nhất của phép nhân ma trận cho thấy phép biến đổi tuyến tính được biểu thị bằng ma trận thỏa mãnH=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

trưng bày nó như là một toán tử chiếu . Vì vậy, bổ sung của nó

Q=1H

(như được đưa ra trong câu hỏi) cũng là một toán tử chiếu. Dấu vết của là thứ hạng (xem bên dưới), từ đó dấu vết của bằng .HhQnh

Từ chính công thức của nó, rõ ràng là ma trận liên quan đến thành phần của hai phép biến đổi tuyến tính và chínhĐầu tiên ( ) biến -vector thành -vector . Thứ hai ( ) là một phép biến đổi từ thành được đưa ra bởi . Thứ hạng của nó không thể vượt quá kích thước nhỏ hơn của hai chiều đó, trong một cài đặt bình phương nhỏ nhất luôn là (nhưng có thể nhỏ hơnJ = ( X ' X ) - X ' X J n y p β X R p R n y = X β p p J H = X J XH

J=(XX)X
XJnypβ^XRpRny^=Xβ^pp, bất cứ khi nào không có thứ hạng đầy đủ). Do đó thứ hạng của các thành phần không thể vượt qua xếp hạng của . Kết luận chính xácJH=XJX

J n tr ( Q ) n - p βtr(Q)=np khi và chỉ khi có thứ hạng đầy đủ; và nói chung . Trong trường hợp trước, mô hình được gọi là "nhận dạng" (đối với các hệ số của ).Jntr(Q)npβ

X XJ sẽ có thứ hạng đầy đủ khi và chỉ khi không thể đảo ngược.XX


Giải thích hình học

n y X Q = 1 - H n y y = H ( y ) + Q ( y ) , X p X p H p Q n - p n - pH biểu thị phép chiếu trực giao từ -vector (đại diện cho "phản hồi" hoặc "biến phụ thuộc") lên khoảng trắng được kéo dài bởi các cột của (đại diện cho "biến độc lập" hoặc "biến số"). Sự khác biệt cho thấy cách phân tách bất kỳ -vector thành một tổng các vectơ trong đó cái đầu tiên có thể được "dự đoán" từ và cái thứ hai vuông góc với nó. Khi các cột của tạo ra một không gian hai chiều (nghĩa là không phải là cộng tuyến),nyXQ=1Hny

y=H(y)+Q(y),
XpXpH là và thứ hạng của là , phản ánh các chiều thay đổi bổ sung của trong phản hồi không được biểu thị trong các biến độc lập. Các dấu vết cho một công thức đại số cho các kích thước này.pQnpnp

Nền đại số tuyến tính

Một toán tử chiếu trên không gian vectơ (chẳng hạn như ) là một phép biến đổi tuyến tính (nghĩa là một phép biến hình của ) sao cho . Điều này làm cho phần bù của nó là một toán tử chiếu, bởi vìR n P : V V V P 2 = P Q = 1 - PVRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

Tất cả các phép chiếu sửa mọi phần tử của hình ảnh của chúng, bất cứ khi nào chúng tôi có thể viết cho một số , khiv = P ( w ) w V w = P ( v ) = P 2 ( v ) = P ( P ( v ) ) = P ( w ) .vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

Kết hợp với bất kỳ tự đồng cấu của là hai subspaces: nó kernelhình ảnh của nó Mọi vectơ có thể được viết dưới dạng trong đó và . Do đó, chúng tôi có thể xây dựng cơ sở cho trong đó và . Khi V ker ( P ) = { v vPV Im ( P ) = { v v

ker(P)={vv|P(v)=0}
v V v
Im(P)={vv|wVP(w)=v}.
vVw Im ( P ) u Ker ( P ) E F V E Ker ( P ) F Im ( P ) V P P E P F f f F f P f ×
v=w+u
wIm(P)uKer(P)EFVEKer(P)FIm(P)Vlà chiều hữu hạn, ma trận của trong cơ sở này do đó sẽ ở dạng khối chéo, với một khối (tương ứng với hành động của trên ) tất cả các số 0 và khác (tương ứng với hoạt động của trên ) tương đương với bởi ma trận sắc, nơi mà các kích thước của là . Dấu vết của là tổng của các giá trị trên đường chéo và do đó phải bằng . Số này là thứ hạng của : kích thước của hình ảnh.PPEPFffFfPPf×1=fP

Dấu vết của bằng với dấu vết của (bằng , thứ nguyên của ) trừ đi dấu vết của . 1 n V P1P1nVP

Những kết quả này có thể được tóm tắt với sự khẳng định rằng dấu vết của một phép chiếu bằng với thứ hạng của nó.


Cảm ơn rất nhiều. Tôi đã học được rất nhiều kiến ​​thức mở rộng từ câu trả lời của bạn.
zhushun0008

19

@Dougal đã đưa ra câu trả lời, nhưng đây là một câu trả lời khác, đơn giản hơn một chút.

Trước tiên, hãy sử dụng thực tế là . Vì vậy, chúng tôi nhận được:Bây giờ là một ma trận danh tính , vì vậy . Bây giờ hãy sử dụng thực tế là , nghĩa là dấu vết là bất biến dưới hoán vị tuần hoàn. Vì vậy, chúng ta có:Khi chúng tôi nhân với , chúng tôi nhận được ma trận danh tính , có dấu vết là . Vì vậy, chúng tôi nhận được:t r ( Q ) = t r ( I ) - t r ( X ( X X ) - 1 X ) . I n × n t r ( I ) = n t r ( Atr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=nt r ( Q ) = n - t rtr(AB)=tr(BA)( X X ) - 1 ( X X
tr(Q)=ntr((XX)1(XX)).
(XX)1p × p p t r ( Q ) = n - p .(XX)p×pp
tr(Q)=np.

6

Giả sử rằng và là thứ hạng đầy đủ.XnpX

Hãy xem xét phân tách giá trị số ít gọn , trong đó là đường chéo và có (nhưng lưu ý được xếp hạng nhiều nhất nên không thể là ). Sau đóX=UΣVTΣRp×pURn×p,VRp×pUTU=VTV=VVT=IpUUTpIn

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

Bây giờ, tồn tại một ma trận sao cho là đơn nhất. Chúng ta có thể viết Biểu mẫu này cho thấy là semidefinite dương và vì nó là một svd hợp lệ và các giá trị số ít là bình phương của các giá trị riêng cho ma trận đối xứng vuông, cũng cho chúng ta biết rằng có giá trị riêng 1 (của bội số ) và 0 (của bội số ).U2Rn×npUn=[UU2]QQn-ppQn-p

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
QQnppQnp.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.