Khi trả lời câu hỏi này, John Christie cho rằng nên đánh giá sự phù hợp của mô hình hồi quy logistic bằng cách đánh giá phần dư. Tôi quen thuộc với cách diễn giải các phần dư trong OLS, chúng có cùng tỷ lệ với DV và rất rõ ràng sự khác biệt giữa y và y được mô hình dự đoán. Tuy nhiên, đối với hồi quy logistic, trước đây tôi thường chỉ kiểm tra các ước tính về mức độ phù hợp của mô hình, ví dụ AIC, vì tôi không chắc chắn phần còn lại có ý nghĩa gì đối với hồi quy logistic. Sau khi xem xét các tệp trợ giúp của R một chút, tôi thấy rằng trong R có năm loại dư glm có sẵn , c("deviance", "pearson", "working","response", "partial")
. Tệp trợ giúp đề cập đến:
- Davison, AC và Snell, EJ (1991) Dư lượng và chẩn đoán. Trong: Lý thuyết thống kê và mô hình hóa. Để vinh danh Ngài David Cox, FRS , eds. Hinkley, DV, Reid, N. và Snell, EJ, Chapman & Hall.
Tôi không có một bản sao đó. Có một cách ngắn để mô tả làm thế nào để giải thích từng loại này? Trong bối cảnh logistic, tổng số dư bình phương sẽ cung cấp một thước đo có ý nghĩa về mức độ phù hợp của mô hình hay là một tiêu chí tốt hơn với Tiêu chí Thông tin?
binnedplot
hàm trong nhánh gói R cung cấp một lô dư rất hữu ích. Nó được mô tả độc đáo trên p.97-101 của Gelman và Hill 2007 .