Lựa chọn hình phạt tối ưu cho Lasso


15

Có bất kỳ kết quả phân tích hoặc tài liệu thử nghiệm nào liên quan đến việc lựa chọn tối ưu hệ số của thời hạn hình phạt 1 . Theo tối ưu , tôi có nghĩa là một tham số tối đa hóa xác suất chọn mô hình tốt nhất hoặc giảm thiểu tổn thất dự kiến. Tôi đang hỏi bởi vì thường thì không thực tế khi chọn tham số bằng cách xác thực chéo hoặc bootstrap, vì một số lượng lớn các vấn đề hoặc do kích thước của vấn đề trong tay. Các chỉ kết quả dương tính tôi biết là Nến và Kế hoạch, gần lý tưởng mô hình lựa chọn bởi 1 giảm thiểu .


2
Bạn có biết các giấy tờ thiết lập kết quả nhất quán cho Lasso không? Knight & Fu (2000), Yu & Zhao (2006) và nhiều loại giấy tờ khác nhau của Meinshausen.
Đức hồng y

Có, nhưng câu hỏi của tôi không phải là về tính nhất quán tiệm cận, mà là chủ đề của các bài báo mà bạn đề cập.
vui vẻ

1
Những bài báo đó (chủ yếu) về tính nhất quán của lựa chọn mô hình , mà tôi muốn nói là rất liên quan đến câu hỏi bạn đã hỏi. :)
hồng y

Câu trả lời:


2

Định lý kiểm tra 5.1 của Bickel et al. . Một sự lựa chọn tối ưu về mặt thống kê về các lỗi λ = Một σ tiếng ồn yy^(λ)22λ=AσnoiselogpnA>22 .


σnoise

5

Tôi tin rằng bạn chủ yếu quan tâm đến hồi quy, như trong bài viết được trích dẫn, chứ không phải các ứng dụng khác của 1-penalty (đồ họa lasso, nói).

Sau đó, tôi tin rằng một số câu trả lời có thể được tìm thấy trong bài báo Về mức độ tự do của thành phố Lasso của Zou et al. Tóm lại, nó đưa ra một công thức phân tích cho các mức độ tự do hiệu quả , đối với việc mất lỗi bình phương cho phép bạn thay thế CV bằng một phân tíchCpthống kê -type, nói.

Một nơi khác để tìm là trong bộ chọn Dantzig: Ước tính thống kê khi p lớn hơn n và các tài liệu thảo luận trong cùng một số Biên niên sử Thống kê. Hiểu biết của tôi là họ giải quyết một vấn đề liên quan chặt chẽ với hồi quy lasso nhưng với một sự lựa chọn cố định về hệ số hình phạt. Nhưng xin vui lòng xem các tài liệu thảo luận quá.

Nếu bạn không quan tâm đến dự đoán, nhưng trong việc lựa chọn mô hình, tôi không nhận thức được kết quả tương tự. Các mô hình tối ưu dự đoán thường dẫn đến quá nhiều biến được chọn trong các mô hình hồi quy. Trong bài viết Lựa chọn độ ổn định Meinshausen và Bühlmann trình bày một kỹ thuật lấy mẫu con hữu ích hơn cho lựa chọn mô hình, nhưng nó có thể đòi hỏi quá nhiều về mặt tính toán cho nhu cầu của bạn.


(+1) Tất cả ba trong số những bài báo đó đều đáng để đọc cẩn thận cho những người quan tâm đến chủ đề này. Bài viết chọn Dantzig có một số phép toán rất hay; tuy nhiên, tôi không thấy nó có nhiều lực kéo trong các ứng dụng, tôi cũng không mong đợi nó. Tôi nghĩ, trong số những thứ khác, những con đường chính quy rất ồn ào khiến mọi người lo lắng và vì vậy, không có lợi ích rõ ràng so với Lasso, làm cho nó trở nên khó bán.
Đức hồng y

Hum, lưu ý rằng mặc dù số lượng các hệ số khác không cho một giá trị đã cho của tham số chính quy là một ước tính không thiên vị cho các DoF ở giá trị đó, ước tính này rất khác nhau.
dohmatob

1

Vì câu hỏi này đã được hỏi, tiến bộ thú vị đã được thực hiện. Ví dụ, xem xét bài viết này

Chichignoud, M., Lederer, J., & Wainwright, M. (2016). Một sơ đồ thực tế và thuật toán nhanh để điều chỉnh Lasso với sự đảm bảo tối ưu. Tạp chí Nghiên cứu Máy học, 17, 1 Từ17.

Họ đề xuất một phương pháp để chọn tham số điều chỉnh LASSO với các đảm bảo mẫu hữu hạn có thể chứng minh được cho việc lựa chọn mô hình. Như họ nói trong bài báo, "Đối với các sơ đồ hiệu chuẩn tiêu chuẩn, trong số đó có Xác nhận chéo, không có đảm bảo nào có thể so sánh được trong tài liệu. Trên thực tế, chúng tôi không biết về bất kỳ đảm bảo mẫu hữu hạn nào cho các sơ đồ hiệu chuẩn tiêu chuẩn".


0

Điều này không trả lời câu hỏi của bạn, nhưng: trong một cài đặt dữ liệu lớn, có thể điều chỉnh bộ chỉnh tần bằng cách sử dụng một phân tách thử nghiệm / thử nghiệm duy nhất, thay vì thực hiện 10 lần hoặc hơn để xác thực chéo (hoặc nhiều hơn cho bootstrap). Kích thước và tính đại diện của mẫu được chọn cho độ lệch xác định độ chính xác của ước tính của bộ chuẩn hóa tối ưu.

Theo kinh nghiệm của tôi, tổn thất giữ tương đối bằng phẳng trong một phạm vi chính quy đáng kể. Tôi chắc chắn rằng thực tế này có thể không giữ cho các vấn đề khác.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.