R2(được mô tả trong câu trả lời khác) là nó phụ thuộc rất nhiều vào phân phối kiểm duyệt dữ liệu của bạn. Những điều tự nhiên khác mà bạn có thể xem xét, chẳng hạn như tỷ lệ khả năng cho mô hình null, cũng có vấn đề này. . những cách được đề xuất để giải quyết vấn đề này, nhưng những cách tôi từng thấy thường yêu cầu bạn phải có một mô hình phân phối kiểm duyệt hoặc một cái gì đó không thực tế. Tôi đã không nhìn vào mức độ xấu của sự phụ thuộc này trong thực tế, vì vậy nếu kiểm duyệt của bạn khá nhẹ, bạn vẫn có thể xem xét các thống kê dựa trên tỷ lệ khả năng. Đối với các mô hình GIỎ HÀNG
τcũng ít nhạy cảm hơn các thống kê ở trên, vì vậy bạn có thể không muốn chọn giữa các mô hình dựa trên nó nếu sự khác biệt giữa chúng là nhỏ; nó hữu ích hơn khi là một chỉ số có thể hiểu được về hiệu suất chung hơn là cách so sánh các mô hình khác nhau.
(Cuối cùng, tất nhiên nếu bạn có mục đích cụ thể cho các mô hình - nghĩa là, nếu bạn biết chức năng mất dự đoán của mình là gì - bạn luôn có thể đánh giá chúng theo chức năng mất! Nhưng tôi đoán bạn ' lại không may mắn lắm ...)
Để thảo luận sâu hơn về cả thống kê tỷ lệ khả năng và c củaellell , bạn nên xem sách giáo khoa Chiến lược mô hình hồi quy tuyệt vời của Mitchell . Phần đánh giá các mô hình sống sót là §19.10, trang 492-493. Tôi xin lỗi tôi không thể cho bạn một câu trả lời dứt khoát, nhưng tôi không nghĩ đây là một vấn đề được giải quyết!