Đây là một câu hỏi thú vị. Đáng ngạc nhiên, có thể làm một cái gì đó theo các giả định nhất định, nhưng có khả năng mất thông tin về phương sai còn lại. Nó phụ thuộc vào mất bao nhiêu.X
Hãy xem xét các giá trị phân hủy ít sau của với một ma trận với các cột trực giao, một đường chéo ma trận với các giá trị đặc biệt tích cực theo đường chéo và a ma trận trực giao. Sau đó, các cột của tạo thành một cơ sở trực giao cho không gian cột của và
là vectơ của các hệ số cho phép chiếu lên không gian cột này khi được mở rộng trong X U n × p D d 1 ≥ d 2 ≥ . . . ≥ d p > 0 V p × p U X Z = U t Y = D - 1 V t V D U t Y = D - 1 V t X t Y Y U Z XX=UDVtXBạnn × pDd1≥ d2≥ . . . ≥ dp> 0Vp × pBạnX
Z= UtY= D- 1VtVD UtY= D- 1VtXtY
YBạnCơ sở U. Từ công thức chúng ta thấy rằng là tính toán từ kiến thức của và chỉ.
ZXXtY
Vì công cụ dự báo hồi quy sườn cho một có thể được tính là
chúng ta thấy rằng các hệ số của công cụ dự báo hồi quy sườn trong cơ sở -column là
Bây giờ chúng ta hãy giả định phân phối mà có trung bình chiều và hiệp phương sai ma trận . Khi đó có -dimensional có nghĩa là và ma trận hiệp phương sai . Nếu chúng ta tưởng tượng một độc lậpY = X ( X t X + λ tôi ) - 1 X t Y = U D ( D 2 + λ tôi ) - 1 D U t Y = U D ( D 2 + λ tôi ) - 1 D Z U Z = D ( D 2 + λ tôi ) -λ
Y^= X( XtX+ λ tôi)- 1XtY= UD ( D2+ λ tôi)- 1D UtY= UD ( D2+ λ tôi)- 1D Z
BạnYnξ σ 2 Tôi n Zp U t ξ σ 2 Tôi p Y New YX Z mới = U t Y New Z E | | Y New - Y | | 2Z^= D ( D2+ λ tôi)- 1D Z.
Ynξσ2TôinZpBạntξσ2TôipYMới có cùng phân phối với (mọi thứ có điều kiện trên từ đây), có cùng phân phối dưới dạng và độc lập và
Ở đây, đẳng thức thứ ba theo sau tính trực giao của và và thứ tư bởi thực tế là
YXZMới= UtYMớiZYmới-UZNewUZmới-U Z UE| | YMới- Y^| |2= == == =E| | YMới- UZMới+ UZMới- UZ^| |2E| | YMới- UZMới| |2+ E| | BạnZMới- UZ^| |2Ơ0+ E| | ZMới- Z^| |2.
YMới- UZMớiBạnZMới- UZ^Bạn có các cột trực giao. Số lượng là một lỗi mà chúng tôi không thể nhận được bất kỳ thông tin nào, nhưng nó cũng không phụ thuộc vào . Để giảm thiểu lỗi dự đoán ở phía bên trái, chúng ta phải giảm thiểu thuật ngữ thứ hai ở phía bên tay phải.
λƠ0λ
Bằng cách tính toán tiêu chuẩn
Ở đây được gọi là mức độ tự do hiệu quả cho hồi quy sườn với tham số . Công cụ ước tính không thiên vị của là
df(λ)λE| | Z-Z| | 2sai(λ)=| | Z-Z| | 2=pΣi=1(1-d2i
E| | ZMới- Z^| |2= == =E| | Z- Z^| |2+ 2 Σi = 1pcov ( ZTôi, Z^Tôi)E| | Z- Z^| |2+ 2 σ2Σi = 1pd2Tôid2Tôi+ λdf ( λ ).
df ( λ)λE| |Z-Z^| |2sai ( λ ) = | | Z- Z^| |2= ∑i = 1p( 1 - ngày2Tôid2Tôi+ λ)2Z2Tôi.
Chúng tôi kết hợp điều này với công cụ ước tính (không thiên vị)
của cho rằng chúng ta biết , sau đó chúng ta cần giảm thiểu. Rõ ràng, điều này chỉ có thể được thực hiện nếu chúng ta biết hoặc có dự đoán hợp lý tại hoặc ước tính của .E | | Z mới - Z | | 2 σ 2 σ 2 σ 2
err ( λ ) + 2 σ2df ( λ )
E| | ZMới- Z^| |2σ2σ2σ2
Ước tính có thể có nhiều vấn đề hơn. Có thể chỉ ra rằng
Do đó, nếu có thể chọn nhỏ đến mức có thể bỏ qua sai lệch bình phương, chúng ta có thể thử ước tính là
Nếu ý chí làm việc này phụ thuộc rất nhiều vào . E | | Z - Z | | 2 = σ 2 ( p - p ∑ i = 1 d 2 iσ2bước sóngσ2σ2=1
E| | Z- Z^| |2= σ2⎛⎝⎜⎜⎜⎜⎜p - Σi = 1pd2Tôid2Tôi+ λ( 2 - ngày2Tôid2Tôi+ λ)d ( λ )⎞⎠⎟⎟⎟⎟⎟+ sai lệch ( λ )2.
λσ2Xσ^2= 1p - d ( λ )| | Z- Z^| |2.
X
Để biết một số chi tiết, hãy xem Phần 3.4.1 và Chương 7 trong ESL hoặc thậm chí tốt hơn Chương 2 trong GAM .