Câu trả lời:
Câu trả lời ngắn: Bất cứ khi nào bạn phải đối mặt với một trong những tình huống sau:
Hồi quy sườn nói chung mang lại dự đoán tốt hơn giải pháp OLS, thông qua sự thỏa hiệp tốt hơn giữa sai lệch và phương sai. Hạn chế chính của nó là tất cả các yếu tố dự đoán được giữ trong mô hình, vì vậy sẽ không thú vị lắm nếu bạn tìm kiếm một mô hình tuyệt vời hoặc muốn áp dụng một số loại lựa chọn tính năng.
Để đạt được độ thưa thớt, Lasso thích hợp hơn nhưng nó sẽ không nhất thiết mang lại kết quả tốt khi có cộng tuyến cao (người ta đã quan sát thấy rằng nếu các yếu tố dự đoán có tương quan cao, hiệu suất dự đoán của Lasso bị chi phối bởi hồi quy sườn núi). Vấn đề thứ hai với hình phạt L1 là giải pháp Lasso không được xác định duy nhất khi số lượng biến lớn hơn số lượng đối tượng (đây không phải là trường hợp hồi quy sườn). Hạn chế cuối cùng của Lasso là nó có xu hướng chỉ chọn một biến trong số một nhóm các yếu tố dự đoán có tương quan cặp cao. Trong trường hợp này, có các giải pháp thay thế như nhóm (nghĩa là đạt được độ co rút trên khối đồng biến, đó là một số khối hệ số hồi quy chính xác bằng 0) hoặc hợp nhấtdây cột ngựa. Các đồ họa Lasso cũng cung cấp tính năng đầy hứa hẹn cho GGMs (xem R glasso gói).
Nhưng, chắc chắn, các elasticnet tiêu chí, đó là sự kết hợp của L1 và L2 phạt đạt được cả hai co rút và lựa chọn biến tự động, và nó cho phép để giữ cho biến trong trường hợp . Theo sau Zou và Hastie (2005), nó được định nghĩa là đối số thu nhỏ (trên )
trong đó và.
Lasso có thể được tính toán bằng thuật toán dựa trên gốc tọa độ như được mô tả trong bài báo gần đây của Friedman và coll., Đường dẫn chính quy cho các mô hình tuyến tính tổng quát thông qua tọa độ tọa độ (JSS, 2010) hoặc thuật toán LARS. Trong R, các gói bị phạt , lars hoặc biglars và glmnet là các gói hữu ích; trong Python, có bộ công cụ scikit.learn , với tài liệu mở rộng về các thuật toán được sử dụng để áp dụng cả ba loại sơ đồ chính quy.
Đối với các tài liệu tham khảo chung, trang Lasso chứa hầu hết những gì cần thiết để bắt đầu với hồi quy Lasso và các chi tiết kỹ thuật về hình phạt L1, và câu hỏi liên quan này có các tài liệu tham khảo thiết yếu, Khi nào tôi nên sử dụng lasso vs ridge?
Một lý do biện minh cho việc sử dụng hồi quy sườn là giải pháp của nó là giá trị trung bình sau được đưa ra bình thường trước các hệ số. Đó là, nếu bạn quan tâm đến lỗi bình phương và bạn tin vào một bình thường trước đó, các ước tính sườn núi là tối ưu.
Tương tự, ước tính lasso là chế độ sau theo cấp số nhân gấp đôi trước các hệ số của bạn. Điều này là tối ưu theo hàm mất không một.
Trong thực tế, các kỹ thuật này thường cải thiện độ chính xác dự đoán trong các tình huống mà bạn có nhiều biến tương quan và không có nhiều dữ liệu. Trong khi công cụ ước tính OLS là không thiên vị tuyến tính tốt nhất, nó có phương sai cao trong các tình huống này. Nếu bạn nhìn vào sự đánh đổi sai lệch sai lệch, độ chính xác dự đoán sẽ được cải thiện bởi vì sự gia tăng nhỏ về độ lệch sẽ được bù đắp nhiều hơn bởi sự giảm lớn của phương sai.