Phạm vi của lambda trong hồi quy mạng đàn hồi


9

Cho hồi quy mạng đàn hồi

minb12||yXb||2+αλ||b||22+(1α)λ||b||1

làm thế nào có thể chọn một phạm vi thích hợp của λ để xác thực chéo?

Trong trường hợp α=1 (hồi quy sườn) công thức

dof=jsj2sj2+λ

có thể được sử dụng để cung cấp một mức độ tự do tương đương cho mỗi lambda (trong đó sj là các giá trị số ít của X ) và mức độ tự do có thể được chọn trong phạm vi hợp lý.

Trong trường hợp α=0 (lasso), chúng ta biết rằng

λ>λmax=maxj|tytXtj|

sẽ dẫn đến tất cả bj bằng 0 và có thể chọn λ trong một số phạm vi (0,λmax) .

Nhưng làm thế nào để xử lý các trường hợp hỗn hợp?

Câu trả lời:


4

Tôi nghĩ bạn nên sử dụng phạm vi từ đến0

λmax=11αλmax

Lý luận của tôi đến từ việc mở rộng trường hợp Lasso, và một dẫn xuất đầy đủ bên dưới. Vòng loại là nó không nắm bắt được ràng buộc đóng góp bởi chính quy . Nếu tôi tìm ra cách khắc phục điều đó (và quyết định xem nó có thực sự cần sửa hay không), tôi sẽ quay lại và chỉnh sửa nó.dof2


Xác định mục tiêu

f(b)=12yXb2+12γb2+δb1

Đây là mục tiêu bạn đã mô tả, nhưng với một số tham số được thay thế để cải thiện sự rõ ràng.

Thông thường, chỉ có thể là một giải pháp cho vấn đề tối ưu hóa nếu độ dốc tại bằng không. Tuy nhiên, thuật ngữ không trơn tru, do đó, điều kiện thực sự là nằm trong cấp dưới tại .b=0minf(b)b=0b10b=0

Cấp con của làf

f=XT(yXb)+γb+δb1

trong đó biểu thị người con đối với . Tại , điều này trở thànhbb=0

f|b=0=XTy+δ[1,1]d

trong đó là kích thước của và a là một khối lập phương . Vì vậy, để bài toán tối ưu hóa có giải pháp , nó phải làdb[1,1]ddb=0

(XTy)iδ[1,1]

cho mỗi thành phần . Điều này tương đương vớii

δ>maxi|jyjXij|

đó là định nghĩa mà bạn đã đưa ra cho . Nếu hiện được hoán đổi, công thức từ đầu bài sẽ rơi ra.λmaxδ=(1α)λ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.