Tại sao nên sử dụng Điểm Gini được chuẩn hóa thay vì AUC như đánh giá?

Cuộc thi của Kaggle Dự đoán tài xế an toàn của Porto Seguro sử dụng Điểm Gini được chuẩn hóa làm chỉ số đánh giá và điều này khiến tôi tò mò về lý do cho sự lựa chọn này. Những lợi thế của việc sử dụng điểm số gini bình thường thay vì các số liệu thông thường nhất, như AUC, để đánh giá là gì?

— xboard
nguồn

Trang web Kaggle đã từng có câu trả lời này: "Có một diện tích tối đa có thể đạt được cho một mô hình" hoàn hảo "vì không phải tất cả các ví dụ tích cực xảy ra ngay lập tức. Chúng tôi sử dụng hệ số Gini được chuẩn hóa bằng cách chia hệ số Gini của mô hình của bạn cho hệ số Gini của mô hình hoàn hảo. " nhưng nó không có sẵn nữa. webcache.googleusercontent.com/ từ

— Sextus Empiricus

Vì vậy, gini chỉ là auc trên một quy mô khác nhau. Hoặc là auc và gini áp dụng cho các đường cong khác nhau? Điều đó không rõ ràng đối với tôi là người không chuyên về máy học. Câu hỏi không rõ ràng lắm về điều này.

— Sextus Empiricus

Tôi tin rằng điểm Gini chỉ là một sự cải tổ của AUC: Vì lý do tại sao sử dụng điều này thay vì AUC thường được sử dụng, lý do duy nhất tôi có thể nghĩ là đó là một dự đoán ngẫu nhiên sẽ mang lại điểm Gini bằng 0 so với AUC là 0,5.

g Tôi n Tôi = = 2 \times Một Bạn C - 1

$gini = 2 \times AUC -1$

— Miguel
nguồn

Bên cạnh đó, việc sử dụng hệ số gini đặt hiệu suất của phân loại ngẫu nhiên thành điểm 0 ... việc chuẩn hóa "cải thiện" đầu kia của thang đo và làm cho điểm của phân loại hoàn hảo bằng 1 thay vì đạt được tối đa AUC <1. Sự cải thiện chỉ mang tính tương đối tùy thuộc vào việc bạn nghĩ thang đo trực quan hơn có tốt hay không. Mặc dù ngoài cách giải thích dễ dàng hơn này, bạn có thể lập luận rằng nó (chuẩn hóa) cũng cải thiện việc khái quát hóa và so sánh các tập dữ liệu khác nhau.

— Sextus Empiricus

Tại sao AUC tối đa có thể đạt được phải nhỏ hơn 1, tôi cũng không thấy gini đặt nó thành 1 như thế nào?

— rep_ho

Nó phụ thuộc vào loại đường cong họ tính hệ số gini. Có thể họ sử dụng một cái gì đó khác với đường cong ROC (có AUC tối đa thực sự sẽ là 1). Đưa ra các từ trên trang web kaggle, có vẻ hợp lý rằng AUC tối đa không phải là 1:> "Sau đó chúng tôi di chuyển từ trái sang phải, hỏi" Trong x% ngoài cùng của dữ liệu, bạn đã tích lũy được bao nhiêu phản hồi tích lũy? "

— Sextus Empiricus

ví dụ: bayesserver.com/docs/charts/lift-chart

— Sextus Empiricus