Hình phạt Lasso chỉ áp dụng cho tập hợp con của hồi quy


7

Câu hỏi này đã được hỏi trước đây nhưng không có câu trả lời, vì vậy tôi nghĩ rằng tôi có thể hỏi lại.

Tôi quan tâm đến việc áp dụng hình phạt Lasso cho một số tập hợp con của các biến hồi quy, tức là với hàm mục tiêu

E=||yX1β1X2β2||2+λ||β1||1

trong đó Lasso chỉ được áp dụng cho β1 nhưng β2 có liên quan đến việc xây dựng lại.

Có bất kỳ lý thuyết đằng sau này? Thứ hai, có cách nào để làm điều này trong sklearn không?

Câu trả lời:


6

Đặt là máy chiếu trực giao vào không gian cột của . Chúng tôi có trong đó H2X2

minβ1,β2{yX1β1X2β222+λβ11}=minβ1,β2{H2(yX1β1)X2β222+(IH2)(yX1β1)22+λβ11}=minβ1|β2minβ2{H2(yX1β1)X2β222+(IH2)(yX1β1)22+λβ11},
β^2=argminβ2{H2(yX1β1)X2β222+(IH2)(yX1β1)22+λβ11}=argminβ2{H2(yX1β1)X2β222}
thỏa mãn cho tất cả kể từ cho tất cả . Xem xét trong câu này, trường hợp là thứ hạng đầy đủ, chúng tôi có thêm vì trong trường hợp này.X2β^2=H2(yX1β1)β1H2(yX1β1)col(X2)β1X2
β^2=(X2TX2)1X2T(yX1β1),
H2=X2(X2TX2)1X2

Cắm vấn đề tối ưu hóa đầu tiên này, chúng tôi thấy rằng có thể được đánh giá thông qua các công cụ tính toán Lasso thông thường. Như whuber gợi ý trong nhận xét của mình, kết quả này là trực quan do các hệ số không giới hạn có thể bao trùm khoảng , do đó chỉ một phần của không gian trực giao với khoảng là đáng quan tâm khi đánh giá .

β^1=argminβ1{0+(IH2)(yX1β1)22+λβ11}(*)=argminβ1{(IH2)y(IH2)X1β122+λβ11},
β2X2X2β^1

Mặc dù ký hiệu là hơi chung chung hơn, nhưng gần như bất cứ ai đã từng sử dụng Lasso đều quen thuộc với kết quả này. Để thấy điều này, giả sử là các vectơ (độ dài ) của các vectơ, đại diện cho phần chặn. Sau đó, ma trận chiếu và, đối với bất kỳ vectơ , phép chiếu trực giao chỉ cần loại bỏ vectơ. Xem xét phương trình , đây chính xác là những gì mọi người làm khi họ tính toán các hệ số Lasso! Họ hạ thấp dữ liệu để việc chặn không cần phải xem xét.X2=1nH2=1(1T1)11T=1n11Tv(IH2)v=vv¯1()


7

Đừng biết rằng bạn cần nhiều "lý thuyết" đằng sau cách tiếp cận như vậy. Phương pháp hồi quy hình phạt (LASSO, sườn núi hoặc hồi quy mạng đàn hồi lai của chúng) là các công cụ để thực hiện sự đánh đổi sai lệch để cải thiện tính tổng quát và hiệu suất của mô hình. Bạn chắc chắn có thể chọn giữ một số biến không được mở rộng, như bạn đề xuất cho , trong khi các biến khác bị phạt. Ví dụ, bài viết này đã kiểm tra tính hiệu quả của vắc-xin bằng cách giữ cho tình trạng tiêm chủng không bị ảnh hưởng trong khi kết hợp các hiệp phương sai khác với hình phạt L2 hồi quy. Cách tiếp cận này đã tránh quá mức cho các đồng biến trong khi cho phép đánh giá trực tiếp các yếu tố dự đoán chính của mối quan tâm.β2

Các câu hỏi về việc triển khai trong các môi trường lập trình cụ thể không có chủ đề trên trang web này. Một cách chung để tiếp cận vấn đề này, như trong glmnetgói trong R, là bao gồm một yếu tố hình phạt dành riêng cho người dự đoán, nhân lên sự lựa chọn chung của trước khi đánh giá hàm mục tiêu. Người dự đoán có các yếu tố hình phạt mặc định là 1, nhưng một người dự đoán có hệ số hình phạt cụ thể là 0 sẽ không bị phạt và một người có yếu tố hình phạt vô hạn sẽ luôn bị loại trừ. Giá trị trung gian của các yếu tố hình phạt khác nhau giữa các yếu tố dự đoán có thể cung cấp bất kỳ hình phạt khác biệt mong muốn giữa các yếu tố dự đoán. Tôi nghi ngờ rằng phương pháp này có thể được kết hợp bằng cách nào đó vào các công cụ được cung cấp bởi .λsklearn


2
+1 Vì thông thường không được chỉ định, nhưng được tìm thấy thông qua một số phương tiện khác, có vẻ như người ta có thể loại bỏ hiệu ứng của trên (bằng cách hồi quy so với ), phù hợp với với là phản hồi và được điều chỉnh như các biến hồi quy và sau đó thực hiện Lasso trên phần dư chỉ sử dụng làm biến hồi quy. Không gian của các giải pháp cho sẽ giống nhau, nhưng tham số có thể được nhân với hằng số (không quan trọng). Cách giải quyết cho hồi quy Ridge thậm chí còn đơn giản hơn . λX1X2X2X1β2YX2X1β1λ
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.