Làm rõ ý nghĩa của các tham số α và Elastic Net
Các thuật ngữ và tham số khác nhau được sử dụng bởi các gói khác nhau, nhưng ý nghĩa nói chung là giống nhau:
Các gói R Glmnet sử dụng định nghĩa sau đây
tối thiểuβ0, β1NΣNi = 1wtôil ( ytôi, β0+ βTxtôi) + λ [ ( 1 - α ) | | β| |22/ 2+α | | β| |1]
Sklearn sử dụng
tối thiểuw12 NΣNi = 1| | y- Xw | |22+ α × l1tỷ lệ | | w | |1+ 0,5 × α × ( 1 - l1tỷ lệ ) × | | w | |22
Cũng có các tham số thay thế sử dụng và ..mộtb
Để tránh nhầm lẫn tôi sẽ gọi
- λ tham số cường độ hình phạt
- L1tỉ lệ tỷ lệ giữa hình phạt và , từ 0 (sườn núi) đến 1 (lasso)L1L2
Hình dung tác động của các tham số
Hãy xem xét một tập dữ liệu mô phỏng trong đó bao gồm một đường cong hình sin nhiễu và là một tính năng hai chiều bao gồm và . Do mối tương quan giữa và , hàm chi phí là một thung lũng hẹp.yXX1= xX2=x2X1X2
Đồ họa dưới đây minh họa đường dẫn giải pháp của hồi quy đàn hồi với hai tham số tỷ lệ khác nhau , như là một hàm của tham số cường độ.L1λ
- Đối với cả hai mô phỏng: khi thì giải pháp là giải pháp OLS ở phía dưới bên phải, với hàm chi phí hình thung lũng liên quan.λ=0
- Khi tăng lên, chính quy hóa bắt đầu và giải pháp có xu hướngλ(0,0)
- Sự khác biệt chính giữa hai mô phỏng là tham số tỷ lệ .L1
- LHS : đối với tỷ lệ nhỏ , hàm chi phí thường xuyên trông rất giống với hồi quy Ridge với các đường viền tròn.L1
- RHS : đối với tỷ lệ lớn , hàm chi phí trông rất giống với hồi quy Lasso với các đường viền hình dạng kim cương điển hình.L1
- Đối với tỷ lệ trung gian (không hiển thị), hàm chi phí là kết hợp của cả haiL1
Hiểu ảnh hưởng của các tham số
ElasticNet được giới thiệu để khắc phục một số hạn chế của Lasso, đó là:
- Nếu có nhiều biến hơn điểm dữ liệu , , lasso chọn tối đa biến.pnp>nn
- Lasso không thực hiện lựa chọn theo nhóm, đặc biệt là khi có các biến tương quan. Nó sẽ có xu hướng chọn một biến từ một nhóm và bỏ qua các biến khác
Bằng cách kết hợp hình phạt và hình phạt bậc hai, chúng tôi có được những lợi thế của cả hai:L1L2
- L1 tạo ra một mô hình thưa thớt
- L2 loại bỏ giới hạn về số lượng biến được chọn, khuyến khích nhóm và ổn định đường dẫn chính quy .L1
Bạn có thể thấy điều này một cách trực quan trên sơ đồ ở trên, các điểm kỳ dị ở các đỉnh khuyến khích sự thưa thớt , trong khi các cạnh lồi nghiêm ngặt khuyến khích nhóm .
Dưới đây là một hình ảnh được lấy từ Hastie (người phát minh ra ElasticNet)
đọc thêm
caret
gói có thể thực hiện lặp lại cv và điều chỉnh cho cả alpha & lambda (hỗ trợ xử lý đa lõi!). Từ bộ nhớ, tôi nghĩ rằngglmnet
tài liệu khuyên không nên điều chỉnh alpha theo cách bạn làm ở đây. Nó khuyến nghị giữ cố định các nếp gấp nếu người dùng đang điều chỉnh alpha ngoài việc điều chỉnh cho lambda được cung cấp bởicv.glmnet
.