Tôi không biết liệu tôi có thể cho bạn một câu trả lời hoàn chỉnh không, nhưng tôi có thể cho bạn một vài suy nghĩ có thể hữu ích. Đầu tiên, tất cả các mô hình / kiểm tra thống kê đều có giả định. Tuy nhiên, hồi quy logistic rất nhiều không cho rằng phần dư được phân phối bình thường cũng như phương sai không đổi. Thay vào đó, người ta cho rằng dữ liệu được phân phối dưới dạng nhị thức, , nghĩa là, với số lượng thử nghiệm Bernoulli bằng với số lượng quan sát tại bộ chính xác đó của các giá trị hiệp biến và với xác suất liên quan đến tập hợp các giá trị hiệp biến đó. Hãy nhớ rằng phương sai của nhị thức là . Như vậy, nếuB(nxi,pxi)np(1−p)nSự khác nhau ở các mức khác nhau của hiệp phương sai, phương sai cũng sẽ như vậy. Hơn nữa, nếu bất kỳ hiệp phương sai nào đều liên quan đến biến trả lời, thì xác suất sẽ thay đổi, và do đó, phương sai cũng vậy. Đây là những sự thật quan trọng về hồi quy logistic.
Thứ hai, so sánh mô hình thường được thực hiện giữa các mô hình với các thông số kỹ thuật khác nhau (ví dụ: với các tập hợp số khác nhau được bao gồm), không vượt qua các tập hợp con khác nhau của dữ liệu. Thành thật mà nói, tôi không chắc làm thế nào điều đó sẽ được thực hiện đúng. Với mô hình tuyến tính, bạn có thể nhìn vào 2 giây để xem mức độ phù hợp tốt hơn với dữ liệu sai lệch được loại trừ, nhưng điều này chỉ mang tính mô tả và bạn nên biết rằng sẽ phải tăng lên. Tuy nhiên, với hồi quy logistic, tiêu chuẩn không thể được sử dụng. Có nhiều giả khác nhau -R2R2R2R2s 'đã được phát triển để cung cấp thông tin tương tự, nhưng chúng thường được coi là thiếu sót và không thường được sử dụng. Đối với một tổng quan về các khác nhau pseudo- s mà tồn tại, xem ở đây . Đối với một số thảo luận, và chỉ trích, trong số họ, xem ở đây . Một khả năng khác có thể là thông qua các betas có và không có các ngoại lệ để xem cách loại trừ chúng góp phần ổn định phân phối lấy mẫu của chúng. Một lần nữa, đây chỉ là mô tả (nghĩa là nó sẽ không tạo thành một thử nghiệm để cho bạn biết mô hình nào - er, tập hợp con của dữ liệu của bạn - thích) và phương sai sẽ phải đi xuống. Những điều này là đúng, cho cả giả-R2R2s và các bản phân phối không xác định, bởi vì bạn đã chọn những dữ liệu đó để loại trừ dựa trên thực tế là chúng có vẻ cực đoan.