Tại sao hình phạt Lasso tương đương với số mũ đôi (Laplace) trước đó?


27

Tôi đã đọc trong một số tài liệu tham khảo rằng ước tính Lasso cho vectơ tham số hồi quy tương đương với chế độ sau của trong đó phân phối trước cho mỗi B_i là phân phối lũy thừa kép (còn được gọi là phân phối Laplace).B B iBBBi

Tôi đã cố gắng để chứng minh điều này, ai đó có thể xác thịt chi tiết không?


@ user777 Hôm nay tôi đã xem qua cuốn sách đó. Không thể tìm thấy bất cứ điều gì có liên quan.
Wintermute

Câu trả lời:


30

Để đơn giản, chúng ta chỉ cần xem xét một quan sát duy nhất về một biến Y sao cho

Y|μ,σ2N(μ,σ2),

μ~Laplace(λ) và trước đó không đúng .f(σ)α1σ>0

Khi đó mật độ khớp của tỷ lệ với f (Y, \ mu, \ sigma ^ 2 | \ lambda) \ propto \ frac {1} {\ sigma} \ exp \ left (- \ frac {(y- \ mu) ^ 2} {\ sigma ^ 2} \ right) \ lần 2 \ lambda e ^ {- \ lambda \ vert \ mu \ vert}. f ( Y , μ , σ 2 | bước sóng ) α 1Y,μ,σ2

f(Y,μ,σ2|λ)α1σđiểm kinh nghiệm(-(y-μ)2σ2)×2λe-λ|μ|.

Lấy nhật ký và loại bỏ các thuật ngữ không liên quan đến μ ,

logf(Y,μ,σ2)=1σ2yμ22λ|μ|.(1)

Do đó, mức tối đa của (1) sẽ là ước tính MAP và thực sự là vấn đề Lasso sau khi chúng tôi reparetrize λ~= =λσ2 .

Phần mở rộng cho hồi quy là rõ ràng - thay thế bằng theo khả năng Bình thường và đặt ưu tiên trên thành một chuỗi các bản phân phối laplace độc lập .X β β ( λ )μXββ(λ)


25

Điều này là hiển nhiên khi kiểm tra số lượng mà LASSO đang tối ưu hóa.

Lấy ưu tiên cho là Laplace độc ​​lập với giá trị trung bình bằng 0 và một số tỷ lệ . τβiτ

Vì vậy, .p(β|τ)e12τi|βi|

Mô hình cho dữ liệu là giả định hồi quy thông thường .yiidN(Xβ,σ2)

f(y|X,β,σ2)(σ2)n/2exp(12σ2(yXβ)T(yXβ))

Bây giờ trừ hai lần nhật ký của hậu thế có dạng

k(σ2,τ,n,p)+ 1σ2(yXβ)T(yXβ)+1τi|βi|

Đặt và chúng tôi nhận được -posterior củaλ=σ2/τ2log

k(σ2,λ,n,p)+ 1σ2[(yXβ)T(yXβ)+λi|βi|]

Công cụ ước tính MAP cho giảm thiểu tối đa ở trên, giúp giảm thiểuβ

S=(yXβ)T(yXβ)+λi|βi|

Vì vậy, công cụ ước tính MAP cho là LASSO.β

(Ở đây tôi đã xử lý như đã được sửa một cách hiệu quả nhưng bạn có thể làm những việc khác với nó và vẫn đưa LASSO ra mắt.)σ2

Chỉnh sửa: Đó là những gì tôi nhận được khi soạn câu trả lời; Tôi không thấy một câu trả lời hay đã được đăng bởi Andrew. Của tôi thực sự không làm bất cứ điều gì anh ấy chưa làm. Bây giờ tôi sẽ rời khỏi tôi vì nó cung cấp thêm một vài chi tiết về sự phát triển về mặt .β


1
Dường như có một sự khác biệt trong câu trả lời của bạn và của Andrew. Câu trả lời của bạn có dạng chính xác của trình chuẩn hóa: , trong khi Andrew có, trong đó trong hồi quy tuyến tính, chúng tôi nhận được . λβ1λ|μ|μ=Xβ
Alex R.

2
@AlexR Tôi nghĩ bạn đang hiểu sai μ trong câu trả lời của Andrew. Ở đó tương ứng với trong hồi quy chỉ có một phần chặn, không phải với trong hồi quy bội; lập luận tương tự như sau đối với trường hợp lớn hơn (lưu ý tương tự với câu trả lời của tôi) nhưng dễ thực hiện hơn trong trường hợp đơn giản. Câu trả lời của Andrew về cơ bản là đúng nhưng không kết nối tất cả các dấu chấm với câu hỏi ban đầu, để lại một lượng nhỏ cho người đọc điền vào. Tôi nghĩ rằng câu trả lời của chúng tôi là nhất quán (có thể có một số khác biệt nhỏ liên quan đến có thể được tính đến) và rằng anh ấy hoàn toàn xứng đáng với tích tắcβ0Xβ
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.