Tại sao dẫn xuất của tôi về một giải pháp lasso dạng đóng không chính xác?


28

Vấn đề lasso có giải pháp dạng đóng: nếu có các cột trực giao. Điều này đã được thể hiện trong chủ đề này: Dẫn xuất của giải pháp lasso dạng đóng .β Lasso j = s g n ( β LS j ) ( | β LS j | - α ) + X

βLasso= =argminβy-Xβ22+αβ1
βjLasso= =Sgn(βjLS)(|βjLS|-α)+
X

Tuy nhiên, tôi không hiểu tại sao không có giải pháp dạng kín nói chung. Sử dụng phân nhóm tôi thu được như sau.

( X là ma trận n×p )

= n Σ i = 1 ( y i - X i β ) 2 + α p Σ j = 1 | β j |

f(β)= =y-Xβ22+αβ1
= =Σtôi= =1n(ytôi-Xtôiβ)2+αΣj= =1p|βj|
( Xtôi là hàng thứ i của X )
= =Σtôi= =1nytôi2-2Σtôi= =1nytôiXtôiβ+Σtôi= =1nβTXtôiTXtôiβ+αΣj= =1p|βj|
fβj= =-2Σtôi= =1nytôiXtôij+2Σtôi= =1nXtôij2βj+βj(α|βj|)
= ={-2Σtôi= =1nytôiXtôij+2Σtôi= =1nXtôij2βj+α cho βj>0-2Σtôi= =1nytôiXtôij+2Σtôi= =1nXtôij2βj-α cho βj<0[-2Σtôi= =1nytôiXtôij-α,-2Σtôi= =1nytôiXtôij+α] cho βj= =0
Với fβj= =0 chúng tôi nhận được

βj= ={(2(Σtôi= =1nytôiXtôij)-α)/2Σtôi= =1nXtôij2cho Σtôi= =1nytôiXtôij>α(2(Σtôi= =1nytôiXtôij)+α)/2Σtôi= =1nXtôij2cho Σtôi= =1nytôiXtôij<-α0 cho Σtôi= =1nytôiXtôij[-α,α]

Có ai thấy tôi đã đi sai ở đâu không?

Câu trả lời:

Nếu chúng ta viết bài toán về các ma trận, chúng ta có thể thấy rất dễ dàng tại sao một giải pháp dạng đóng chỉ tồn tại trong trường hợp trực giao với XTX= =tôi :

f(β)= =y-Xβ22+αβ1
= =yTy-2βTXTy+βTXTXβ+αβ1
f(β)= =-2XTy+2XTXβ+(α|β1)
(Tôi đã thực hiện nhiều bước cùng một lúc tại đây. Tuy nhiên, cho đến thời điểm này hoàn toàn tương tự với đạo hàm của giải pháp bình phương nhỏ nhất. Vì vậy, bạn sẽ có thể tìm thấy các bước còn thiếu ở đó.)
fβj= =-2XjTy+2(XTX)jβ+βj(α|βj|)

Với fβj= =0 chúng tôi nhận được

2(XTX)jβ= =2XjTy-βj(α|βj|)
2(XTX)jjβj= =2XjTy-βj(α|βj|)-2Σtôi= =1,tôijp(XTX)jtôiβtôi

Bây giờ chúng ta có thể thấy rằng giải pháp của chúng tôi cho một phụ thuộc vào tất cả các vì vậy không rõ cách tiến hành từ đây. Nếu là trực giao, chúng ta có vì vậy chắc chắn tồn tại một giải pháp dạng đóng trong trường hợp này.βjβtôijX2(XTX)jβ= =2(tôi)jβ= =2βj

Cảm ơn Guðmundur Einarsson cho câu trả lời của anh ấy, trên đó tôi đã xây dựng ở đây. Tôi hy vọng lần này là chính xác :-)


3
Chào mừng bạn đến với CrossValidated, và chúc mừng bài đăng đầu tiên rất hay!
S. Kolassa - Tái lập Monica

Câu trả lời:


16

Điều này thường được thực hiện với hồi quy góc tối thiểu, bạn có thể tìm thấy bài báo ở đây .

Xin lỗi về sự nhầm lẫn của tôi lúc đầu, tôi sẽ thực hiện một nỗ lực khác vào lúc này.

Vì vậy, sau khi mở rộng chức năng của bạn bạn nhận đượcf(β)

f(β)=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|

Sau đó, bạn tính đạo hàm riêng đối với . Mối quan tâm của tôi là trong tính toán của bạn về đạo hàm riêng của thuật ngữ cuối cùng trước định mức 1, tức là thuật ngữ bậc hai. Hãy xem xét thêm. Chúng tôi có điều đó:βj

Xiβ=βTXiT=(β1Xi1+β2Xi2++βpXip)
Vì vậy, về cơ bản bạn có thể viết lại thuật ngữ bậc hai của bạn là: Bây giờ chúng ta có thể sử dụng quy tắc chuỗi để tính đạo hàm của wrt này :
i=1nβTXiTXiβ=i=1n(Xiβ)2
βj
βji=1n(Xiβ)2=i=1nβj(Xiβ)2=i=1n2(Xiβ)Xij

Vì vậy, bây giờ vấn đề của bạn không đơn giản hóa dễ dàng, bởi vì bạn có tất cả các hệ số có trong mỗi phương trình.β

Điều này không trả lời câu hỏi của bạn về lý do tại sao không có giải pháp dạng đóng của Lasso, tôi có thể thêm một cái gì đó sau đó.


1
Cảm ơn rất nhiều. Bây giờ tôi thực sự có thể thấy tại sao không có giải pháp dạng đóng (xem phần chỉnh sửa của tôi).
Norbert

Ngọt! Công việc tuyệt vời :)
Gumeo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.