Cả hai chỉ số đều là thước đo sức mạnh của sự liên kết (nghĩa là liệu có bất kỳ yếu tố dự đoán nào có liên quan đến kết quả hay không, như đối với thử nghiệm LR) và có thể được sử dụng để định lượng khả năng dự đoán hoặc hiệu suất mô hình. Một công cụ dự đoán duy nhất có thể có ảnh hưởng đáng kể đến kết quả nhưng nó có thể không nhất thiết hữu ích cho việc dự đoán đáp ứng riêng lẻ , do đó cần phải đánh giá toàn bộ hiệu suất của mô hình (mô hình null). Nagelkerke rất hữu ích vì nó có giá trị tối đa là 1.0, như Srikant nói. Đây chỉ là phiên bản chuẩn hóa của tính từ tỷ lệ khả năng,R2R2R2LR=1−exp(−LR/n), có mối liên hệ với thống kê Wald cho sự liên kết tổng thể, như đề xuất ban đầu của Cox và Snell. Các chỉ số khác về khả năng dự đoán là điểm Brier, chỉ số C (xác suất phù hợp hoặc khu vực ROC) hoặc Som 'D, hai chỉ số sau cung cấp một biện pháp phân biệt dự đoán tốt hơn.
Các giả định duy nhất được thực hiện trong hồi quy logistic là tính tuyến tính và tính gây nghiện (+ tính độc lập). Mặc dù nhiều bài kiểm tra mức độ phù hợp toàn cầu (như bài kiểm tra của Hosmer & Lemeshow , nhưng hãy xem nhận xét của tôi về @onestop) đã được đề xuất, nhưng nhìn chung họ thiếu sức mạnh. Để đánh giá mức độ phù hợp của mô hình, tốt hơn là dựa vào các tiêu chí trực quan (ước tính phân tầng, làm mịn không theo tỷ lệ) giúp phát hiện sự khởi hành cục bộ hoặc toàn cầu giữa các kết quả được dự đoán và quan sát (ví dụ như phi tuyến tính hoặc tương tác), và điều này chủ yếu được nêu chi tiết trong RMS củaellell Bản tin . Về một chủ đề liên quan (kiểm tra hiệu chuẩn), Steyerberg ( Mô hình dự đoán lâm sàngχ2, 2009) chỉ ra cách tiếp cận tương tự để đánh giá sự thỏa thuận giữa các kết quả được quan sát và xác suất dự đoán:
Hiệu chuẩn có liên quan đến mức độ phù hợp, liên quan đến khả năng của một mô hình phù hợp với một tập hợp dữ liệu nhất định. Thông thường, không có thử nghiệm độ phù hợp duy nhất nào có sức mạnh tốt để chống lại tất cả các loại thiếu phù hợp của mô hình dự đoán. Các ví dụ về sự không phù hợp bị bỏ sót phi tuyến tính, tương tác hoặc chức năng liên kết không phù hợp giữa yếu tố dự đoán tuyến tính và kết quả. Mức độ phù hợp có thể được kiểm tra với
thống kê . (trang 274)χ2
Ông cũng đề nghị dựa vào sự khác biệt tuyệt đối giữa các kết quả được quan sát trơn tru và các xác suất dự đoán bằng trực quan, hoặc với cái gọi là thống kê E củaellell.
Thông tin chi tiết có thể được tìm thấy trong cuốn sách của Gurell, Chiến lược mô hình hồi quy (trang 203-205, 230-244, 247-249). Đối với một cuộc thảo luận gần đây, xem thêm
Steyerberg, EW, Vickers, AJ, Cook, NR, Gerds, T, Gonen, M, Obuchowski, N, Pencina, MJ, và Kattan, MW (2010). Đánh giá hiệu suất của các mô hình dự đoán, Khung cho các biện pháp truyền thống và tiểu thuyết . Dịch tễ học , 21 (1) , 128-138.