Giấy ròng đàn hồi ban đầu Zou & Hastie (2005) Chính quy hóa và lựa chọn biến qua lưới đàn hồi giới thiệu hàm mất mạng đàn hồi cho hồi quy tuyến tính (ở đây tôi giả sử tất cả các biến được tập trung và chia tỷ lệ thành phương sai đơn vị): nhưng được gọi là "lưới đàn hồi ngây thơ". Họ lập luận rằng nó thực hiện co rút gấp đôi (lasso và sườn núi), có xu hướng co lại quá mức và có thể được cải thiện bằng cách thay đổi kích thước giải pháp thu được như sau: \ hat \ beta ^ * = (1+ \ lambda_2) \ hat \ beta. Họ đã đưa ra một số lập luận lý thuyết và bằng chứng thực nghiệm rằng điều này dẫn đến hiệu suất tốt hơn.
Tuy nhiên, glmnet
bài báo tiếp theo Friedman, Hastie, & Tibshirani (2010) Các đường dẫn chính quy cho các mô hình tuyến tính tổng quát thông qua gốc tọa độ đã không sử dụng phép thay đổi tỷ lệ này và chỉ có một chú thích ngắn gọn
Zou và Hastie (2005) gọi hình phạt này là lưới đàn hồi ngây thơ , và ưa thích một phiên bản thay đổi kích thước mà họ gọi là lưới đàn hồi. Chúng tôi bỏ sự phân biệt này ở đây.
Không có lời giải thích nào được đưa ra ở đó (hoặc trong bất kỳ sách giáo khoa nào của Hastie và cộng sự). Tôi thấy nó hơi khó hiểu. Có phải các tác giả đã bỏ qua việc chỉnh sửa lại vì họ cho rằng nó quá đặc biệt ? bởi vì nó thực hiện tồi tệ hơn trong một số thí nghiệm tiếp theo? bởi vì không rõ làm thế nào để khái quát nó cho trường hợp GLM? Tôi không có ý kiến. Nhưng trong mọi trường hợp, glmnet
gói trở nên rất phổ biến kể từ đó và vì vậy ấn tượng của tôi là ngày nay không ai sử dụng việc thay đổi kích thước từ Zou & Hastie, và hầu hết mọi người thậm chí có thể không biết về khả năng này.
Câu hỏi: sau tất cả, đây có phải là một ý tưởng tốt hay một ý tưởng tồi?
Với glmnet
tham số hóa, Zou & Hastie thay đổi kích thước phải là
glmnet
mã. Nó không có sẵn ở đó ngay cả khi là một tính năng tùy chọn (mã trước đó của họ đi kèm với bài báo năm 2005 tất nhiên hỗ trợ thay đổi kích thước).