+1 trên hình minh họa của Glen_b và các nhận xét về số liệu thống kê về công cụ ước tính của Ridge. Tôi chỉ muốn thêm một phép toán thuần túy (đại số tuyến tính) vào hồi quy Ridge để trả lời các câu hỏi OP 1) và 2).
Đầu tiên lưu ý rằng là ma trận bán nguyệt dương đối xứng - lần so với ma trận hiệp phương sai mẫu. Do đó, nó có sự phân hủy bản địaX′Xp×pn
X′X=VDV′,D=⎡⎣⎢⎢d1⋱dp⎤⎦⎥⎥,di≥0
Bây giờ vì nghịch đảo ma trận tương ứng với đảo ngược các giá trị riêng, công cụ ước tính OLS yêu cầu (lưu ý rằng ). Rõ ràng điều này chỉ hoạt động nếu tất cả các giá trị riêng đều lớn hơn 0, . Đối với điều này là không thể; Đối với thì nói chung là đúng - điều này là do chúng ta thường quan tâm đến tính đa hình .(X′X)−1=VD−1V′V′=V−1di>0p≫nn≫p
Là nhà thống kê, chúng tôi cũng muốn biết những nhiễu loạn nhỏ trong dữ liệu thay đổi các ước tính. Rõ ràng là một thay đổi nhỏ trong bất kỳ nào dẫn đến sự thay đổi lớn trong nếu rất nhỏ.Xdi1/didi
Vì vậy, những gì hồi quy Ridge thực hiện là di chuyển tất cả các giá trị riêng ra xa hơn 0
X′X+λIp=VDV′+λIp=VDV′+λVV′=V(D+λIp)V′,
hiện có eigenvalues . Đây là lý do tại sao việc chọn tham số hình phạt dương làm cho ma trận không thể đảo ngược - ngay cả trong trường hợp . Đối với hồi quy Ridge, một biến thể nhỏ trong dữ liệu không còn có tác dụng cực kỳ không ổn định đối với ma trận đảo ngược.
di+λ≥λ≥0p≫nX
Độ ổn định số có liên quan đến độ co về 0 vì cả hai đều là hệ quả của việc thêm hằng số dương vào giá trị riêng: nó làm cho nó ổn định hơn vì nhiễu loạn nhỏ trong không thay đổi nghịch đảo quá nhiều; nó thu nhỏ lại gần bằng kể từ bây giờ thuật ngữ được nhân với gần bằng 0 so với giải pháp OLS với giá trị riêng nghịch đảo .X0V−1X′y1/(di+λ)1/d