Cuộc thi của Kaggle Dự đoán tài xế an toàn của Porto Seguro sử dụng Điểm Gini được chuẩn hóa làm chỉ số đánh giá và điều này khiến tôi tò mò về lý do cho sự lựa chọn này. Những lợi thế của việc sử dụng điểm số gini bình thường thay vì các số liệu thông thường nhất, như AUC, để đánh giá là gì?
1
Trang web Kaggle đã từng có câu trả lời này: "Có một diện tích tối đa có thể đạt được cho một mô hình" hoàn hảo "vì không phải tất cả các ví dụ tích cực xảy ra ngay lập tức. Chúng tôi sử dụng hệ số Gini được chuẩn hóa bằng cách chia hệ số Gini của mô hình của bạn cho hệ số Gini của mô hình hoàn hảo. " nhưng nó không có sẵn nữa. webcache.googleusercontent.com/ từ
—
Sextus Empiricus
Vì vậy, gini chỉ là auc trên một quy mô khác nhau. Hoặc là auc và gini áp dụng cho các đường cong khác nhau? Điều đó không rõ ràng đối với tôi là người không chuyên về máy học. Câu hỏi không rõ ràng lắm về điều này.
—
Sextus Empiricus