Độ phức tạp thời gian tiệm cận của hồi quy Lasso là gì khi số lượng hàng hoặc cột tăng lên?
Độ phức tạp thời gian tiệm cận của hồi quy Lasso là gì khi số lượng hàng hoặc cột tăng lên?
Câu trả lời:
Hãy nhớ lại rằng lasso là một mô hình tuyến tính với độ chính quy .
Việc tìm các tham số có thể được coi là một vấn đề tối ưu hóa không bị ràng buộc, trong đó các tham số được đưa ra bởi
.
Trong định dạng bị ràng buộc, các tham số được cho bởi
Đó là một vấn đề lập trình bậc hai và do đó đa thức.
Hầu như tất cả các thói quen tối ưu hóa lồi, ngay cả đối với những thứ phi tuyến linh hoạt như mạng thần kinh, đều dựa vào tính toán đạo hàm của các tham số wrt đích của bạn. Bạn không thể lấy đạo hàm của mặc dù. Như vậy bạn dựa vào các kỹ thuật khác nhau. Có nhiều phương pháp để tìm các tham số. Dưới đây là một bài viết đánh giá về chủ đề, Tối ưu hóa bình phương tối thiểu với chính quy L1-Norm . Độ phức tạp thời gian của tối ưu hóa lồi lặp là loại khó để phân tích, vì nó phụ thuộc vào một tiêu chí hội tụ. Nói chung, các vấn đề lặp lại hội tụ trong ít kỷ nguyên hơn khi các quan sát tăng lên.
Mặc dù @JacobMick cung cấp một cái nhìn tổng quan rộng hơn và liên kết đến một bài đánh giá, hãy để tôi đưa ra "câu trả lời tắt" (có thể được coi là trường hợp đặc biệt trong câu trả lời của anh ấy).
Đặt số lượng biến số ứng viên (tính năng, cột) là và kích thước mẫu (số lượng quan sát, hàng) là n . Xem xét LASSO được triển khai bằng thuật toán LARS ( Efron et al., 2004 ). Độ phức tạp tính toán của LASSO là O ( K 3 + K 2 n ) ( sđd. )
Người giới thiệu: