Đây là vấn đề 3.23 trên trang 97 của Hastie và cộng sự, Các yếu tố của học thống kê , thứ 2. chủ biên (In lần thứ 5) .
Chìa khóa của vấn đề này là sự hiểu biết tốt về bình phương tối thiểu thông thường (nghĩa là hồi quy tuyến tính), đặc biệt là tính trực giao của các giá trị được trang bị và phần dư.
Xn×pyβXββ^=(XTX)−1XTyy^=X(XTX)−1XTy⟨y^,y−y^⟩=y^T(y−y^)=0XT(y−y^)=XTy−XTX(XTX)−1XTy=XTy−XTy=0
xjxjjX
- 1N⟨xj,xj⟩=1j1N⟨y,y⟩=1
- 1N⟨xj,1p⟩=1N⟨y,1p⟩=01pp
- 1N|⟨xj,y⟩|=λj
⟨xj,y−y^⟩=0j
Các mối tương quan được gắn
u(α)=αXβ^=αy^
⟨xj,y−u(a)⟩=⟨xj,(1−α)y+αy−αy^⟩=(1−α)⟨xj,y⟩+α⟨xj,y−y^⟩,
1N|⟨xj,y−u(α)⟩|=(1−α)λ,
ρ^j(α)=1N|⟨xj,y−u(α)⟩|1N⟨xj,xj⟩−−−−−−−−√1N⟨y−u(α),y−u(α)⟩−−−−−−−−−−−−−−−−−−√=(1−α)λ1N⟨y−u(α),y−u(α)⟩−−−−−−−−−−−−−−−−−−√
jxjy
αp
Hình thức rõ ràng của mối tương quan (tuyệt đối)
⟨y−u(α),y−u(α)⟩=⟨(1−α)y+αy−u(α),(1−α)y+αy−u(α)⟩.
u(α)=αy^
⟨y−u(α),y−u(α)⟩=(1−α)2⟨y,y⟩+2α(1−α)⟨y,y−y^⟩+α2⟨y−y^,y−y^⟩.
Quan sát rằng
- ⟨y,y⟩=N
- ⟨y,y−y^⟩=⟨y−y^,y−y^⟩+⟨y^,y−y^⟩=⟨y−y^,y−y^⟩
- ⟨y−y^,y−y^⟩=RSS
Đặt tất cả những thứ này lại với nhau, bạn sẽ nhận thấy rằng chúng tôi nhận được
ρ^j(α)=(1−α)λ(1−α)2+α(2−α)NRSS−−−−−−−−−−−−−−−−−√=(1−α)λ(1−α)2(1−RSSN)+1NRSS−−−−−−−−−−−−−−−−−−−−−√
1−RSSN=1N(⟨y,y,⟩−⟨y−y^,y−y^⟩)≥0ρ^j(α)αρ^j(α)↓0α↑1
Phần kết : Tập trung vào các ý tưởng ở đây. Thực sự chỉ có một. Các lemma trực giao thực hiện hầu hết các công việc cho chúng tôi. Phần còn lại chỉ là đại số, ký hiệu và khả năng đưa hai cái cuối cùng này hoạt động.