Có, bạn nên tính đến quy mô sản lượng và cũng nên đưa vào tài khoản quy mô của các biến số trong .yX
Đặt là ma trận thiết kế, có các hàng là vectơ với mỗi mục nhập là một hiệp phương thức cùng nhau tìm cách giải thích phản hồi . Mỗi mục nhập của phản hồi (đối với ) được cấu thành một cách phụ thuộc vào tín hiệu phụ thuộc vào các đồng biến và nhiễu iid có nghĩa là 0. Việc chọn mô hình tín hiệu là xấp xỉ tuyến tính dẫn chúng ta đến ước tính LASSO theo điều kiện đặt hàng đầu tiên,X∈Rn×py∈Rnyi=f(eTiX)+ϵii=1,…,nf
β^λ=argminβ12n∥y−Xβ∥22+λ∥β∥1,
−1nXT(y−Xβ^λ)=λz^λ, trong đó là biến kép thỏa mãn nếu và nếu .
z^λz^λ,j=sgn(β^λ,j)β^λ,j≠0z^λ,j∈[−1,1]β^λ,j=0
Cắm vào phương trình này, chúng ta thấy rằng , tạoβ^λ=0−1nXTy=λz^λ
1n∥XTy∥∞=λ∥z^λ∥∞.
Nếu , thì có thể giảm (với tăng để duy trì sự bình đẳng) và LASSO ước tính vẫn sẽ là . Do đó, tại , giá trị nhỏ nhất của tạo ra , chúng tôi nhận được∥z^λ∥∞≠1λ∥z^λ∥∞β^λ=0λmaxλβ^λ=0
1n∥XTy∥∞=λmax⋅1.
Điều này cho chúng ta biết rằng không cần phải xem xét khi điều chỉnh LASSO. Bây giờ, trong thực tế, hầu hết các bộ giải chuẩn hóa các cột của để không cần phải tính trực tiếp. (Lưu ý rằng việc chuẩn hóa các đồng biến là hợp lý vì các đơn vị đo không ảnh hưởng đến hệ số ước tính.)λ>λmaxX
Trường hợp sườn núi được thảo luận tốt ở đây: Hình phạt tối đa cho hồi quy sườn núi