Một phương pháp chung để tạo ra các giải pháp thưa thớt là thông qua ước tính MAP với giá trị trung bình bằng 0 trước khi có phương sai không xác định.
p(xi|σ2i)∼N(0,σ2i)
Nếu sau đó bạn chỉ định trước có chế độ ở mức 0 thì chế độ sau thường thưa thớt. Các phát sinh từ phương pháp này bằng cách tham gia một phân phối trộn theo cấp số nhân.σ2iL1
p(σ2i|λ)∼Expo(λ22)
Sau đó, bạn nhận được
log[p(xi|λ)]=−λ|xi|+log[λ2]
Một số lựa chọn thay thế là pareto đôi tổng quát, một nửa cauch, beta đảo ngược. Trong một số ý nghĩa, những thứ này tốt hơn Lasso vì chúng không thu nhỏ các giá trị lớn. Trong thực tế, tôi khá chắc chắn rằng pareto kép tổng quát có thể được viết dưới dạng hỗn hợp của số mũ. Đó là chúng ta viết và sau đó đặt một gamma trước . Chúng tôi nhận được:λ=λip(λi|αβ)
p(xi|αβ)=α2β(1+|xi|β)−(α+1)
Lưu ý rằng tôi đã bao gồm các hằng số chuẩn hóa, vì chúng giúp chọn các tham số toàn cầu tốt. Bây giờ nếu chúng ta áp dụng giới hạn phạm vi thì chúng ta có một vấn đề phức tạp hơn, vì chúng ta cần tái chuẩn hóa trên đơn giản.
Một đặc điểm chung khác của các hình phạt gây ra thưa thớt là chúng không khác biệt ở mức 0. Thông thường điều này là do các giới hạn bên trái và bên phải là dấu hiệu ngược lại.
Điều này dựa trên công trình tuyệt vời của Nicolas Arlingtonon và James Scott về các biểu diễn hỗn hợp có nghĩa là phương sai mà họ sử dụng để phát triển TIRLS - một phần mở rộng lớn của các hình vuông nhỏ nhất cho một lớp kết hợp hình phạt thua lỗ rất lớn.
Để thay thế, bạn có thể sử dụng một ưu tiên được xác định trên đơn giản, nhưng có các chế độ trong phân phối biên ở mức 0. Một ví dụ là phân phối dirichlet với tất cả các tham số từ 0 đến 1. Hình phạt ngụ ý sẽ như sau:
−∑i=1n−1(ai−1)log(xi)−(an−1)log(1−∑i=1n−1xi)
Trong đó . Tuy nhiên, bạn sẽ cần phải cẩn thận trong việc tối ưu hóa số lượng vì hình phạt có điểm kỳ dị. Một quá trình ước tính mạnh mẽ hơn là sử dụng trung bình sau. Mặc dù bạn mất độ thưa chính xác, bạn sẽ nhận được nhiều phương tiện sau gần với zero.p0<ai<1