Xác địnhChúng tôi biết rằng , do hình phạt có nguồn gốc là công cụ thu nhỏ.
w^λ=argminwL(Θ,X,y)+λ∥w∥22.
limλ→∞w^λ=0w↦∥w∥22
Sycorax chỉ ra rằng, tương tự,Việc khái quát hóa thành công này có thể khiến chúng tôi đề xuất công cụ ước tính trong đó là một hàm mà tối thiểu hóa đáp ứng một số tài sản mà chúng tôi tìm kiếm. Thật vậy, Sycorax lấy , trong đó được giảm thiểu (duy nhất) tại điểm gốc và đặc biệt là . Do đó , như mong muốn. Thật không may, mặc dù, cả hai sự lựa chọn củalimλ→∞{argminwL(Θ,X,y)+λ∥w−c∥22}=c.
w~λ=argminwL(Θ,X,y)+λpen(w),
penpen(w)=g(∥w∥22−5)gg∈{|⋅|,(⋅)2}limλ→∞∥w~λ∥22=5gdẫn đến các hình phạt không thông minh, khiến người ước tính khó tính toán.
Phân tích trên dường như là giải pháp tốt nhất (có thể tùy thuộc vào lựa chọn của , mà tôi không có gợi ý nào tốt hơn) nếu chúng tôi nhấn mạnh vào như là cách giải thích duy nhất của "có xu hướng" được mô tả trong câu hỏi. Tuy nhiên, giả định rằng , có tồn tại một số để các minimizer của vấn đề satsifes OP của . Do đó mà không cần thay đổi hàm mục tiêu. Nếu không có như vậy tồn tại, thì vấn đề của máy tínhgλ→∞∥argminwL(Θ,X,y)∥22≥5Λw^Λ∥w^Λ∥22=5
limλ→Λ∥w^λ∥22=5,
Λargminw:∥w∥22=5L(Θ,X,y) về bản chất là khó khăn. Thật vậy, không cần phải xem xét bất kỳ công cụ ước tính nào ngoài khi cố gắng khuyến khích các thuộc tính tự nhiên của .
w^λ∥w^λ∥22
(Để thực thi rằng một người ước tính bị phạt đạt được một giá trị của hình phạt mà người ước tính không đạt được có vẻ không tự nhiên đối với tôi. Nếu bất cứ ai biết về bất kỳ nơi nào mà điều này thực sự mong muốn, xin vui lòng bình luận!)