Mối quan hệ LASSO giữa và


10

Hiểu biết của tôi về hồi quy LASSO là các hệ số hồi quy được chọn để giải quyết vấn đề tối thiểu hóa:

minβyXβ22 s.t.β1t

Trong thực tế, điều này được thực hiện bằng cách sử dụng hệ số nhân Lagrange, làm cho vấn đề cần giải quyết

minβyXβ22+λβ1

Mối quan hệ giữa λt gì? Wikipedia chỉ đơn giản nói rằng "phụ thuộc dữ liệu".

Sao tôi phải quan tâm? Thứ nhất cho trí tò mò trí tuệ. Nhưng tôi cũng lo ngại về hậu quả của việc chọn λ bằng cách xác thực chéo.

Cụ thể, nếu tôi thực hiện xác thực chéo n lần, tôi khớp n mô hình khác nhau với n phân vùng khác nhau của dữ liệu đào tạo của tôi. Sau đó, tôi so sánh độ chính xác của từng mô hình trên dữ liệu chưa sử dụng cho một λ . Nhưng cùng một λ ngụ ý một ràng buộc ( t ) khác nhau cho các tập hợp con khác nhau của dữ liệu (nghĩa là t=f(λ) là "phụ thuộc dữ liệu").

Không phải là vấn đề xác thực chéo mà tôi thực sự muốn giải quyết để tìm ra t mang lại sự đánh đổi độ chính xác tốt nhất?

Tôi có thể có được một ý tưởng sơ bộ về kích thước của hiệu ứng này trong thực tế bằng cách tính toán cho mỗi lần phân tách xác thực chéo và và xem xét phân phối kết quả. Trong một số trường hợp, ràng buộc ngụ ý ( ) có thể thay đổi đáng kể trong các tập hợp xác thực chéo của tôi. Về cơ bản, ý tôi là hệ số biến thiên trong .β1λtt>>0


5
Nâng cấp để hủy bỏ downvote không giải thích được. Câu hỏi nằm ngoài chuyên môn của tôi nhưng có vẻ như được xây dựng hợp lý.
mkt - Tái lập Monica

Câu trả lời:


2

Đây là giải pháp chuẩn cho hồi quy sườn núi :

β=(XX+λI)1Xy

Chúng tôi cũng biết rằng , vì vậy nó phải đúngβ=t

(XX+λI)1Xy=t
.

không dễ để giải quyết cho .λ

Đặt cược tốt nhất của bạn là chỉ tiếp tục làm những gì bạn đang làm: tính trên cùng một mẫu con của dữ liệu trên nhiều giá trị .tλ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.