Phạm vi tham số điều chỉnh Lasso và Ridge


7

Trong hồi quy tuyến tính sườn và lasso, một bước quan trọng là chọn tham số điều chỉnh lambda, tôi thường sử dụng tìm kiếm lưới theo tỷ lệ nhật ký từ -6-> 4, nó hoạt động tốt trên sườn núi, nhưng trên lasso, tôi nên tính đến thứ tự độ lớn của đầu ra y? ví dụ: nếu đầu ra y ở quy mô nano (-9), phạm vi tìm kiếm của tôi cho nhật ký lambda có thể là -15 -> -5.

tất cả các tham số đầu vào được chuẩn hóa, chúng nằm trong -3,3

Câu trả lời:


4

Có, bạn nên tính đến quy mô sản lượng và cũng nên đưa vào tài khoản quy mô của các biến số trong .yX

Đặt là ma trận thiết kế, có các hàng là vectơ với mỗi mục nhập là một hiệp phương thức cùng nhau tìm cách giải thích phản hồi . Mỗi mục nhập của phản hồi (đối với ) được cấu thành một cách phụ thuộc vào tín hiệu phụ thuộc vào các đồng biến và nhiễu iid có nghĩa là 0. Việc chọn mô hình tín hiệu là xấp xỉ tuyến tính dẫn chúng ta đến ước tính LASSO theo điều kiện đặt hàng đầu tiên,XRn×pyRnyi=f(eiTX)+ϵii=1,,nf

β^λ=argminβ12nyXβ22+λβ1,
1nXT(yXβ^λ)=λz^λ, trong đó là biến kép thỏa mãn nếu và nếu .z^λz^λ,j=sgn(β^λ,j)β^λ,j0z^λ,j[1,1]β^λ,j=0

Cắm vào phương trình này, chúng ta thấy rằng , tạoβ^λ=01nXTy=λz^λ

1nXTy=λz^λ.

Nếu , thì có thể giảm (với tăng để duy trì sự bình đẳng) và LASSO ước tính vẫn sẽ là . Do đó, tại , giá trị nhỏ nhất của tạo ra , chúng tôi nhận đượcz^λ1λz^λβ^λ=0λmaxλβ^λ=0

1nXTy=λmax1.

Điều này cho chúng ta biết rằng không cần phải xem xét khi điều chỉnh LASSO. Bây giờ, trong thực tế, hầu hết các bộ giải chuẩn hóa các cột của để không cần phải tính trực tiếp. (Lưu ý rằng việc chuẩn hóa các đồng biến là hợp lý vì các đơn vị đo không ảnh hưởng đến hệ số ước tính.)λ>λmaxX

Trường hợp sườn núi được thảo luận tốt ở đây: Hình phạt tối đa cho hồi quy sườn núi


3

Trong gói R glmnet, hàm cv.glmnetphù hợp với một mô hình trên toàn bộ tập dữ liệu để chọn đường dẫn chính quy phù hợp và sau đó thực hiện xác thực chéo bằng cách sử dụng đường dẫn đó. Điều này dường như hoạt động tốt trong thực tế.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.