KKT so với công thức không giới hạn của hồi quy lasso


20

Hồi quy bị phạt L1 (còn gọi là lasso) được trình bày theo hai công thức. Đặt hai hàm mục tiêu là

Q1=12||YXβ||22Q2=12||YXβ||22+λ||β||1.
Sau đó, hai công thức khác nhau là
argminβQ1
môn học để
||β||1t,
và, tương đương
argminβQ2.
Sử dụng các điều kiện Karush-Kuhn-Tucker (KKT), thật dễ dàng để thấy điều kiện ổn định cho công thức đầu tiên tương đương với việc lấy độ dốc của công thức thứ hai và đặt nó bằng 0. Những gì tôi không thể tìm thấy, cũng không thể tìm ra , là cách điều kiện kia tưởng đâu bổ sung cho việc xây dựng đầu tiên,λ(||β||1t)=0 , được đảm bảo để được thực hiện bởi các giải pháp cho việc xây dựng thứ hai.

Câu trả lời:


16

Hai công thức là tương đương theo nghĩa là cho mỗi giá trị của trong việc xây dựng đầu tiên, có tồn tại một giá trị của λ cho việc xây dựng thứ hai như vậy mà hai công thức có minimizer cùng β .tλβ

Đây là lời biện minh:

Xét công thức Lasso: Hãy để minimizer đượcβ*và để chob=| | β

f(β)=12||YXβ||22+λ||β||1
β . Tuyên bố của tôi là rằng nếu bạn đặt t = b trong việc xây dựng đầu tiên, sau đó là giải pháp của công thức đầu tiên cũng sẽ được β * . Đây là bằng chứng:b=||β||1t=bβ

Hãy xem xét công thức đầu tiên Nếu có thể hãy để công thức thứ hai này có một giải pháp β như vậy| | beta | | 1<| | β| | 1=b

min12||YXβ||22 s.t.||β||1b
β^||β^||1<||β||1=b (lưu ý nghiêm ngặt ít hơn dấu). Sau đó, nó rất dễ dàng để thấy rằng Trái ngược với thực tế là β * là một giải pháp cho Lasso. Do đó, giải pháp cho công thức đầu tiên cũng là β .f(β^)<f(β)ββ

, điều kiện độ chùng bổ sung được thỏa mãn tại điểm giải pháp β .t=bβ

Vì vậy, với công thức Lasso có , bạn xây dựng một công thức bị ràng buộc bằng cách sử dụng t bằng giá trị của định mức l 1 của giải pháp lasso. Ngược lại, với một công thức bị ràng buộc với t , bạn tìm thấy một λ sao cho giải pháp cho lasso sẽ bằng với giải pháp của công thức bị ràng buộc.λtl1tλ

(Nếu bạn biết về subgradients, bạn có thể tìm thấy điều này bằng cách giải phương trình X T ( y - X β * ) = λ z * , nơi z *| | β * | | 1 )λXT(yXβ)=λzz||β||1)


1
Xuất sắc. Một khi bạn thấy giải pháp bạn luôn cảm thấy ngớ ngẩn vì không tự mình đến đó. Tôi giả sử bạn có nghĩa là, trong việc tìm kiếm các mâu thuẫn, giả sử chúng ta tìm thấy một β như vậy | | beta | | 1 < | | β | | 1 = b ? β^||β^||1<||β||1=b
goodepic

Xem xét câu trả lời flaggin là chính xác
bdeonovic

2
bạn có thể xây dựng tại sao f(β^)<f(β)
goofd

Điều này chứng tỏ rằng giải pháp cho công thức đầu tiên cũng phải có chỉ tiêu l1 là b. Làm thế nào để chứng minh rằng hai giải pháp thực sự giống nhau?
broncoAbierto

1
Ngoài ra, Lasso không phải lúc nào cũng có một giải pháp duy nhất, vì vậy chúng tôi không thể tham khảo bộ giảm thiểu. arxiv.org/pdf/1206.0313.pdf . Chúng ta có thể, tuy nhiên, hãy tham khảo bộ minimizers và cho thấy rằng một số betabeta * phải thuộc về bộ đó. β^β
broncoAbierto

3

Tôi nghĩ rằng ý tưởng của elexhulk cho bằng chứng này là một ý tưởng hay, nhưng tôi không nghĩ nó hoàn toàn chính xác.

Trong cho thấy sự tồn tại của một giải pháp cho việc xây dựng đầu , chẳng hạn rằng β< β * dẫn đến một mâu thuẫn, chúng tôi chỉ có thể giả định sự cần thiết của β= β * , không rằng ββ^β^<ββ^=β .β^=β

Tôi đề nghị, thay vào đó, chúng tôi tiến hành như sau:

P1P2P2ββ=bP1β^ββ^βf(β^)f(β)f(β^)<f(β)βP2f(β^)=f(β)β^=β, since we assumed the solution to be unique.

However, it may be the case that the Lasso has multiple solutions. By lemma 1 of arxiv.org/pdf/1206.0313.pdf we know that all of these solutions have the same 1-norm (and the same minimum value, of course). We set that norm as the constraint for the P1 and proceed.

Let's denote by S the set of solutions to P2, with β=b βS. Let P1 have a solution, β^S. Then, we have that β^ββS and therefore f(β^)f(β)βS. If f(β^)=f(β) for some βS (and hence for all of them) then β^S, which contradicts our assumptions. If f(β^)<f(β) for some βS then S is not the set of solutions to P2. Therefore, every solution to P1 is in S, i.e. any solution to P1 is also a solution to P2. It would remain to prove that the complementary holds too.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.