Đặt là nhóm mà bạn quan tâm; nghĩa là, hãy để G là phân vùng của { 1 , Mạnh , p } , trong đó chúng tôi coi đó là các tính năng p . Với phản ứng y ∈ R n và thiết kế ma trận X ∈ R n × p , nhóm Lasso ước lượng là arg min beta ∈ R p 1GG{ 1 , ... , p }py∈ RnX∈ Rn × pÁp dụng một phươngℓ2hình phạt để gây co rút tổng thể, chúng tôi muốn có được ước lượngargminbeta∈ R p 1
tranh luậntối thiểuβ∈ Rp12 n∥ y- Xβ∥22+Bước sóng Σg∈G|G|1/ 2∥βg∥2.
ℓ2Chúng tôi có thể gọi đây là "lưới đàn hồi nhóm". Bằng cách nhị nguyên Lagrangian, chúng ta có thể viết
arg min beta ∈ R p 1tranh luậntối thiểuβ∈ Rp12 n∥ y- Xβ∥22+ Bước sóng Σg∈ G| G|1 / 2∥ βg∥2+ μ ∥ β∥22.
nơi
~μlà biến kép tương ứng và
~μ'=p-1/2~μtranh luậntối thiểuβ∈ Rp= =tranh luậntối thiểuβ∈ Rp:∥ β∥22≤ C= =tranh luậntối thiểuβ∈ Rp:∥ β∥2≤ C√= =tranh luậntối thiểuβ∈ Rp= =tranh luậntối thiểuβ∈ Rp12 n∥ y- Xβ∥22+ Bước sóng Σg∈ G| G|1 / 2∥ βg∥2+ μ ∥ β∥2212 n∥ y- Xβ∥22+ Bước sóng Σg∈ G| G|1 / 2∥ βg∥212 n∥ y- Xβ∥22+ Bước sóng Σg∈ G| G|1 / 2∥ βg∥212 n∥ y- Xβ∥22+ Bước sóng Σg∈ G| G|1 / 2∥ βg∥2+ μ~∥ β∥212 n∥ y- Xβ∥22+ ( λ ∑g∈ G| G|1 / 2∥ βg∥2+ μ~'p1 / 2∥ β∥2) ,
μ~μ~'= p- 1 / 2μ~. Như chúng ta có thể thấy, biểu hiện cuối cùng đây là một Lasso nhóm với "chồng chéo" nhóm, vì
không còn là một phân vùng. Hơn nữa, nhóm
{ 1 , ... , p } có một biến kép (hoặc biến điều chỉnh)
~ μ đó là khác biệt từ biến kép
λ cho các nhóm khác.
G∪ { 1 , ... , p }{ 1 , ... , p }μ~λ
Đây có thể là vấn đề tối ưu hóa có thể được giải quyết bằng cách sử dụng gói gglasso
. Đọc phần trên trang 9 của tài liệu ở đây sẽ cho bạn biết về gglasso
chức năng, nên được sử dụng. Lưu ý rằng đối số pmax
sẽ phải được cung cấp thủ công với thành phần cuối cùng sẽ đóng vai trò là tham số điều chỉnh.