Mặc dù câu hỏi này và câu trả lời đầu tiên của nó dường như tập trung vào các vấn đề lý thuyết về hiệu chuẩn mô hình hồi quy logistic, vấn đề:
Làm thế nào người ta có thể phá hỏng sự hiệu chuẩn của hồi quy logistic ...?
xứng đáng được chú ý đối với các ứng dụng trong thế giới thực, dành cho những độc giả tương lai của trang này. Chúng ta không nên quên rằng mô hình hồi quy logistic phải được chỉ định rõ và vấn đề này có thể đặc biệt rắc rối đối với hồi quy logistic.
Đầu tiên, nếu tỷ lệ cược log của thành viên lớp không liên quan tuyến tính với các yếu tố dự đoán có trong mô hình thì nó sẽ không được hiệu chỉnh tốt. Chương 10 về Hồi quy nhị phân nhị phân của Mitchell dành khoảng 20 trang cho "Đánh giá mức độ phù hợp với mô hình" để người ta có thể tận dụng "tính không thiên vị của công cụ ước tính khả năng tối đa", như @whuber đưa ra, trong thực tế.
Thứ hai, đặc tả mô hình là một vấn đề cụ thể trong hồi quy logistic, vì nó có một sai lệch biến bị bỏ qua vốn có thể gây ngạc nhiên cho những người có nền tảng trong hồi quy tuyến tính thông thường. Như trang đó đặt nó:
Các biến bị bỏ qua sẽ thiên vị các hệ số trên các biến được bao gồm ngay cả khi các biến bị bỏ qua không tương thích với các biến được bao gồm.
Trang đó cũng có một lời giải thích hữu ích về lý do tại sao hành vi này được mong đợi, với một lời giải thích lý thuyết cho các mô hình probit có thể phân tích, có thể phân tích. Vì vậy, trừ khi bạn biết rằng bạn đã bao gồm tất cả các yếu tố dự đoán liên quan đến tư cách thành viên của lớp, bạn có thể gặp nguy hiểm về lỗi chính tả và hiệu chuẩn kém trong thực tế.
Đối với đặc tả mô hình, hoàn toàn có khả năng các phương pháp dựa trên cây như rừng ngẫu nhiên, không giả định tuyến tính trên toàn bộ phạm vi của các giá trị dự đoán và vốn đã cung cấp khả năng tìm kiếm và bao gồm cả tương tác giữa các yếu tố dự đoán, sẽ kết thúc tốt hơn mô hình hiệu chuẩn trong thực tế hơn mô hình hồi quy logistic không tính đến các thuật ngữ tương tác hoặc phi tuyến tính đủ. Đối với sai lệch biến bị bỏ qua, tôi không rõ liệu có phương pháp nào để đánh giá xác suất thành viên lớp có thể giải quyết vấn đề đó một cách thỏa đáng hay không.