Tôi nghĩ bạn nên sử dụng phạm vi từ đến0
λ′max=11−αλmax
Lý luận của tôi đến từ việc mở rộng trường hợp Lasso, và một dẫn xuất đầy đủ bên dưới. Vòng loại là nó không nắm bắt được ràng buộc đóng góp bởi chính quy . Nếu tôi tìm ra cách khắc phục điều đó (và quyết định xem nó có thực sự cần sửa hay không), tôi sẽ quay lại và chỉnh sửa nó.dofℓ2
Xác định mục tiêu
f(b)=12∥y−Xb∥2+12γ∥b∥2+δ∥b∥1
Đây là mục tiêu bạn đã mô tả, nhưng với một số tham số được thay thế để cải thiện sự rõ ràng.
Thông thường, chỉ có thể là một giải pháp cho vấn đề tối ưu hóa nếu độ dốc tại bằng không. Tuy nhiên, thuật ngữ không trơn tru, do đó, điều kiện thực sự là nằm trong cấp dưới tại .b=0minf(b)b=0∥b∥10b=0
Cấp con của làf
∂f=−XT(y−Xb)+γb+δ∂∥b∥1
trong đó biểu thị người con đối với . Tại , điều này trở thành∂bb=0
∂f|b=0=−XTy+δ[−1,1]d
trong đó là kích thước của và a là một khối lập phương . Vì vậy, để bài toán tối ưu hóa có giải pháp , nó phải làdb[−1,1]ddb=0
(XTy)i∈δ[−1,1]
cho mỗi thành phần . Điều này tương đương vớii
δ>maxi∣∣∣∣∑jyjXij∣∣∣∣
đó là định nghĩa mà bạn đã đưa ra cho . Nếu hiện được hoán đổi, công thức từ đầu bài sẽ rơi ra.λmaxδ=(1−α)λ