Lưới đàn hồi


8

Lasso và lưới đàn hồi không thể xử lý các biến có nhiều hơn hai loại và do đó, việc phân chia các biến phân loại thành các hình nộm là cần thiết cho việc áp dụng các phương pháp này. Điều này có thể dẫn đến một số vấn đề và do đó tồn tại các phần mở rộng cho lasso cho nhóm lasso hoặc nhóm lasso thưa thớt .

Tuy nhiên, tôi tự hỏi nếu các phần mở rộng như vậy cũng tồn tại cho mạng đàn hồi. Thật không may, tôi đã không thể tìm thấy bất kỳ tài liệu thống kê về chủ đề này.

Câu hỏi: Có tồn tại một lưới đàn hồi nhóm?


1
Nhìn vào gói glmnet của R ...
kjetil b halvorsen

1
Vâng, tôi nghĩ đó là chính xác.
kjetil b halvorsen

1
Theo một nghĩa rất thực, "lưới đàn hồi nhóm" này chỉ là một phiên bản của "nhóm lasso" nơi các nhóm được phép chồng lên nhau. Chẳng hạn, nếu G là tập hợp các nhóm của bạn, thì hãy chạy nhóm lasso trên G{{1,Giáo dục,p}} , trong đó chúng tôi coi đó là các tính năng p . Đây sẽ là tương đương với nhóm lên net đàn hồi đến một reparameterization của điều chỉnh thông số kiểm soát {1,Giáo dục,p} .
user795305

2
Tập hợp không còn là phân vùng, không giống như chính G. (Đây là nhận xét chồng chéo.) Phần về tham số hóa khác nhau chỉ liên quan đến chức năng mục tiêu mà tôi thảo luận là việc xác định lại tham số mà bạn có thể đang thảo luận. Nhận xét này phần lớn có thể được bỏ qua imo. Ngoài ra, quy trình @kjetilbhalvorsen khuyến nghị không có vẻ đúng. Việc nhóm được thảo luận là khi có một phản ứng đa biến. Điều đó khác biệt. Tuy nhiên, bạn có thể, ví dụ, sử dụng gói để làm điều này. G{{1,Giáo dục,p}}Ggglasso
user795305

2
(Lưu ý: Không đặt dấu cách sau dấu "@", nếu không người dùng sẽ không được thông báo.)
user795305

Câu trả lời:


5

Đặt là nhóm mà bạn quan tâm; nghĩa là, hãy để G là phân vùng của { 1 , Mạnh , p } , trong đó chúng tôi coi đó là các tính năng p . Với phản ứng y R n và thiết kế ma trận X R n × p , nhóm Lasso ước lượng là arg min beta R p 1GG{1,Giáo dục,p}pyRnXRn×pÁp dụng một phương2hình phạt để gây co rút tổng thể, chúng tôi muốn có được ước lượngargminbeta R p 1

tranh luậntối thiểuβRp12ny-Xβ22+λΣgG|G|1/2βg2.
2Chúng tôi có thể gọi đây là "lưới đàn hồi nhóm". Bằng cách nhị nguyên Lagrangian, chúng ta có thể viết arg min beta R p 1
tranh luậntối thiểuβRp12ny-Xβ22+λΣgG|G|1/2βg2+μβ22.
nơi~μlà biến kép tương ứng và~μ'=p-1/2~μ
tranh luậntối thiểuβRp12ny-Xβ22+λΣgG|G|1/2βg2+μβ22= =tranh luậntối thiểuβRp:β22C12ny-Xβ22+λΣgG|G|1/2βg2= =tranh luậntối thiểuβRp:β2C12ny-Xβ22+λΣgG|G|1/2βg2= =tranh luậntối thiểuβRp12ny-Xβ22+λΣgG|G|1/2βg2+μ~β2= =tranh luậntối thiểuβRp12ny-Xβ22+(λΣgG|G|1/2βg2+μ~'p1/2β2),
μ~μ~'= =p-1/2μ~. Như chúng ta có thể thấy, biểu hiện cuối cùng đây là một Lasso nhóm với "chồng chéo" nhóm, vì không còn là một phân vùng. Hơn nữa, nhóm { 1 , ... , p } có một biến kép (hoặc biến điều chỉnh) ~ μ đó là khác biệt từ biến kép λ cho các nhóm khác.G{1,Giáo dục,p}{1,Giáo dục,p}μ~λ

Đây có thể là vấn đề tối ưu hóa có thể được giải quyết bằng cách sử dụng gói gglasso. Đọc phần trên trang 9 của tài liệu ở đây sẽ cho bạn biết về gglassochức năng, nên được sử dụng. Lưu ý rằng đối số pmaxsẽ phải được cung cấp thủ công với thành phần cuối cùng sẽ đóng vai trò là tham số điều chỉnh.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.