Độ phức tạp thời gian của hồi quy Lasso là gì?


Câu trả lời:


4

Hãy nhớ lại rằng lasso là một mô hình tuyến tính với độ chính quy .l1

Việc tìm các tham số có thể được coi là một vấn đề tối ưu hóa không bị ràng buộc, trong đó các tham số được đưa ra bởi

.argminβ||yXβ||2+α||β||1

Trong định dạng bị ràng buộc, các tham số được cho bởi

argminβ||yXβ||2s.t.||β||1<α

Đó là một vấn đề lập trình bậc hai và do đó đa thức.

Hầu như tất cả các thói quen tối ưu hóa lồi, ngay cả đối với những thứ phi tuyến linh hoạt như mạng thần kinh, đều dựa vào tính toán đạo hàm của các tham số wrt đích của bạn. Bạn không thể lấy đạo hàm của mặc dù. Như vậy bạn dựa vào các kỹ thuật khác nhau. Có nhiều phương pháp để tìm các tham số. Dưới đây là một bài viết đánh giá về chủ đề, Tối ưu hóa bình phương tối thiểu với chính quy L1-Norm . Độ phức tạp thời gian của tối ưu hóa lồi lặp là loại khó để phân tích, vì nó phụ thuộc vào một tiêu chí hội tụ. Nói chung, các vấn đề lặp lại hội tụ trong ít kỷ nguyên hơn khi các quan sát tăng lên.α||w||1


4
Một số điều: nói rằng một vấn đề là "đa thức" không đặc biệt hữu ích, trừ khi có lẽ bạn đang xem xét một số loại vấn đề tổ hợp (thường là theo cấp số nhân). Thứ hai, tính toán các công cụ phái sinh là khá nhiều luôn không phải là bước giới hạn. Thứ ba, thông thường khi thảo luận về độ phức tạp thời gian của thuật toán lặp, người ta thường xem xét chi phí cho mỗi bước và do đó không phụ thuộc vào tiêu chí hội tụ. Cuối cùng, đó không phải là trường hợp quan sát nhiều hơn = lặp ít hơn.
Vách đá AB

13

Mặc dù @JacobMick cung cấp một cái nhìn tổng quan rộng hơn và liên kết đến một bài đánh giá, hãy để tôi đưa ra "câu trả lời tắt" (có thể được coi là trường hợp đặc biệt trong câu trả lời của anh ấy).

Đặt số lượng biến số ứng viên (tính năng, cột) là và kích thước mẫu (số lượng quan sát, hàng) là n . Xem xét LASSO được triển khai bằng thuật toán LARS ( Efron et al., 2004 ). Độ phức tạp tính toán của LASSO là O ( K 3 + K 2 n ) ( sđd. )KnO(K3+K2n)

  • Với , K 3 < K 2 n và độ phức tạp tính toán của LASSO là O ( K 2 n ) , tương tự như hồi quy với các biến K ( Efron et al., 2004 , p. 443-444 ; cũng được trích dẫn trong Schmidt, 2005 , phần 2.4; về độ phức tạp tính toán của hồi quy, xem bài này ).K<nK3<K2nO(K2n)K
  • Đối với , K 3K 2 n và mức độ phức tạp tính toán của Lasso là O ( K 3 ) ( Efron et al., 2004KnK3K2nO(K3) ).

Người giới thiệu:


Richard, bạn có thể nhận xét về độ phức tạp lặp lại cho cách tiếp cận GLM ở đây stats.stackexchange.com/questions/280304/ không?
rnoodle

@moodle, tôi không thể không đào sâu vào vấn đề đó (lúc này tôi không có thời gian), nhưng +1 cho câu hỏi của bạn.
Richard Hardy

Tôi đã có một cái nhìn, nhưng nó không rõ ràng - sẽ rất tốt để có được một đôi mắt thứ hai trên nó. Vì vậy, có độ phức tạp lặp và độ phức tạp hội tụ đầy đủ, và tôi nghĩ rằng văn học đôi khi mơ hồ đôi khi qua các định nghĩa. Về cơ bản, tôi có một thuật toán sử dụng bộ giải Lasso ở vị trí rất quan trọng sao cho độ phức tạp của thuật toán của tôi phụ thuộc rất nhiều vào bộ giải. Sẽ tốt để đóng đinh này. Chúc mừng! Tôi sẽ đặt tiền thưởng cho đầu vào của bạn
rnoodle

@rnoodle, tôi cực kỳ nghi ngờ tôi sẽ có thể giúp bạn ở đó bất cứ lúc nào sớm, nhưng tiền thưởng chắc chắn có thể thu hút những người khác biết rõ hơn. Chúc may mắn!
Richard Hardy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.