Đối với nghiên cứu hiện tại của tôi, tôi đang sử dụng phương pháp Lasso thông qua gói glmnet trong R trên biến phụ thuộc nhị thức.
Trong glmnet, lambda tối ưu được tìm thấy thông qua xác nhận chéo và các mô hình kết quả có thể được so sánh với các biện pháp khác nhau, ví dụ như lỗi phân loại sai hoặc sai lệch.
Câu hỏi của tôi: Làm thế nào chính xác được xác định sai lệch trong glmnet? Nó được tính như thế nào?
(Trong bài viết tương ứng "Đường dẫn chính quy cho các mô hình tuyến tính tổng quát thông qua việc điều phối gốc" của Friedman và cộng sự. Tôi chỉ tìm thấy nhận xét này về độ lệch được sử dụng trong cv.glmnet: "độ lệch trung bình (trừ hai lần khả năng đăng nhập ở bên trái dữ liệu) "(trang 17)).
glm
(hoặc ít nhất, nó phải vậy - chỉ có một định nghĩa về độ lệch mà tôi biết).