Trên trang 223 trong phần Giới thiệu về Học thống kê , các tác giả tóm tắt sự khác biệt giữa hồi quy sườn và lasso. Họ cung cấp một ví dụ (Hình 6.9) khi "Lasso có xu hướng vượt trội hơn so với hồi quy sườn núi về độ lệch, phương sai và MSE".
Tôi hiểu tại sao lasso có thể được mong muốn: nó dẫn đến các giải pháp thưa thớt vì nó thu nhỏ nhiều hệ số về 0, dẫn đến các mô hình đơn giản và dễ hiểu. Nhưng tôi không hiểu làm thế nào nó có thể vượt trội hơn khi chỉ dự đoán được quan tâm (ví dụ như làm thế nào để có được MSE thấp hơn đáng kể trong ví dụ?).
Với sườn núi, nếu nhiều yếu tố dự đoán hầu như không ảnh hưởng đến phản ứng (với một số yếu tố dự đoán có ảnh hưởng lớn), thì hệ số của chúng chỉ đơn giản là bị thu nhỏ lại thành một con số rất gần với 0 ... dẫn đến một thứ rất giống với Lasso ? Vậy tại sao mô hình cuối cùng có hiệu suất kém hơn Lasso?