Trong cảm biến nén, có một định lý đảm bảo rằng có một giải pháp thưa thớt duy nhất c (Xem phụ lục để biết thêm chi tiết).c
Có một định lý tương tự cho Lasso? Nếu có một định lý như vậy, nó không chỉ đảm bảo tính ổn định của Lasso mà còn cung cấp cho Lasso một cách giải thích có ý nghĩa hơn:
Lasso có thể khám phá những thưa thớt hệ số hồi quy vector được sử dụng để tạo ra các phản ứng bởi .
Có hai lý do mà tôi hỏi câu hỏi này:
Tôi nghĩ rằng 'lasso thích một giải pháp thưa thớt' không phải là câu trả lời cho lý do tại sao sử dụng lasso để lựa chọn tính năng vì chúng ta thậm chí không thể biết lợi thế của các tính năng mà chúng ta chọn là gì.
Tôi đã học lasso nổi tiếng là không ổn định để lựa chọn tính năng. Trong thực tế, chúng ta phải chạy các mẫu bootstrap để đánh giá tính ổn định của nó. Lý do quan trọng nhất gây ra sự bất ổn này là gì?
Ruột thừa:
Cho . là một vectơ thưa thớt ( ). Quá trình tạo ra phản hồi . Nếu có NSP (thuộc tính không gian rỗng) theo thứ tự và ma trận hiệp phương sai của không có giá trị riêng gần bằng 0, sẽ có một giải pháp duy nhất cho
Định lý này cũng cho biết nếu không có NSP theo thứ tự , thì việc giải quyết .
BIÊN TẬP:
Sau khi nhận được những câu trả lời tuyệt vời này, tôi nhận ra rằng tôi đã bối rối khi hỏi câu hỏi này.
Tại sao câu hỏi này khó hiểu:
Tôi đã đọc một bài nghiên cứu trong đó chúng ta phải quyết định có bao nhiêu tính năng (cột) ma trận thiết kế sẽ có (các tính năng phụ được tạo từ các tính năng chính). Vì đây là một vấn đề điển hình , dự kiến sẽ được xây dựng tốt để giải pháp cho Lasso có thể là một xấp xỉ tốt của giải pháp thưa thớt thực sự.
Lý do được đưa ra từ định lý mà tôi đã đề cập trong phần phụ lục: Nếu chúng ta nhắm đến việc tìm một giải pháp cude , tốt hơn là có NSP theo thứ tự .
Đối với ma trận , nếu bị vi phạm, thì
không ổn định và phục hồi mạnh mẽ của từ và có thể
tương ứng với , tương ứng với
... như mong đợi từ mối quan hệ , việc lựa chọn bộ mô tả trở nên không ổn định hơn, nghĩa là, đối với các bộ huấn luyện khác nhau, bộ mô tả được chọn thường khác nhau ...
Câu nói thứ hai là phần làm tôi bối rối. Dường như với tôi khi bất bình đẳng bị vi phạm, nó không chỉ là giải pháp có thể không duy nhất (không được đề cập), mà bộ mô tả cũng sẽ trở nên không ổn định hơn.