Với mô hình tuyến tính tổng quát, biện pháp toán học được tối thiểu hóa được gọi là "độ lệch" (-2 * khả năng đăng nhập). Có một số loại dư có thể được phát triển. "Phần dư sai lệch" là các thuật ngữ riêng lẻ trong một biểu thức phức tạp khiêm tốn. Tôi nghĩ đây là những điều dễ hiểu nhất khi áp dụng cho các biến phân loại. Đối với một biến phân loại sử dụng hồi quy logistic, đây chỉ là sự khác biệt giữa tỷ lệ cược log (mô hình) và tỷ lệ cược log (dữ liệu), nhưng đối với các biến liên tục thì chúng có phần phức tạp hơn. Dư lượng sai lệch là những gì được giảm thiểu trong quá trình lặp lại. Xem mô tả này tại trang web UCLA để biết một số lô tốt đẹp còn sót lại.
Theo tôi, phân tích về "thang máy" được thực hiện theo thang độ xác suất, thay vì theo tỷ lệ tỷ lệ cược hoặc tỷ lệ cược hoặc khả năng. Tôi thấy rằng Frank Harrell đã đưa ra một số lời khuyên và bất kỳ tranh chấp nhận thức nào giữa Frank và tôi nên được giải quyết bằng cách cân nhắc lớn về ý kiến của Frank. (Lời khuyên của tôi sẽ là mua cuốn sách RMS của Frank.) Tôi ngạc nhiên khi anh ấy không đưa ra lời khuyên để xem xét các phương pháp bị phạt và rằng anh ấy đã không đưa ra một cảnh báo chống lại sự phù hợp quá mức. Tôi nghĩ rằng việc chọn một phép biến đổi chỉ đơn giản là vì nó tối đa hóa "lực nâng" sẽ giống với việc chọn các mô hình tối đa hóa "độ chính xác". Tôi biết anh ấy không tán thành chiến lược đó.