Hãy nhớ rằng hồi quy sườn không thể lấy ra các hệ số; do đó, bạn sẽ kết thúc bao gồm tất cả các hệ số trong mô hình hoặc không có hệ số nào trong số chúng. Ngược lại, LASSO tự động thu hẹp cả tham số và lựa chọn biến. Nếu một số đồng biến của bạn có mối tương quan cao, bạn có thể muốn xem xét Mạng đàn hồi [3] thay vì LASSO.
Cá nhân tôi khuyên bạn nên sử dụng Garotte không âm (NNG) [1] vì nó phù hợp về mặt ước tính và lựa chọn biến [2]. Không giống như LASSO và hồi quy sườn, NNG yêu cầu ước tính ban đầu sau đó được thu nhỏ về nguồn gốc. Trong bài báo gốc, Breiman đề xuất giải pháp bình phương nhỏ nhất cho ước tính ban đầu (tuy nhiên bạn có thể muốn bắt đầu tìm kiếm từ giải pháp hồi quy sườn và sử dụng một cái gì đó như GCV để chọn tham số hình phạt).
Về phần mềm có sẵn, tôi đã triển khai NNG gốc trong MATLAB (dựa trên mã FORTRAN gốc của Breiman). Bạn có thể tải xuống từ:
http://www.emakalic.org/blog/wp-content/uploads/2010/04/nngarotte.zip
BTW, nếu bạn thích giải pháp Bayes, hãy xem [4,5].
Người giới thiệu:
[1] Breiman, L. Hồi quy tập hợp con tốt hơn bằng cách sử dụng công nghệ Garrote không âm, 1995, 37, 373-384
[2] Yuan, M. & Lin, Y. Trên tạp chí ước tính garrotte không âm của Tạp chí Hiệp hội Thống kê Hoàng gia (sê-ri B), 2007, 69, 143-161
[3] Zou, H. & Hastie, T. Chính quy hóa và lựa chọn biến qua Tạp chí mạng đàn hồi của Hiệp hội Thống kê Hoàng gia (Sê-ri B), 2005, 67, 301-320
[4] Park, T. & Casella, G. Tạp chí Bayesian Lasso của Hiệp hội Thống kê Hoa Kỳ, 2008, 103, 681-686
[5] Kyung, M.; Hân, J.; Ghosh, M. & Casella, G. Hồi quy hình phạt, Lỗi tiêu chuẩn và Phân tích Bayesian Lassos Bayesian, 2010, 5, 369-412