Trên đây là câu trả lời tốt.
Sk e w = n e ga t i v ee x a m p l e sp o s i t i v ee x a m p l e s
Với dữ liệu không cân bằng, AUC vẫn mang lại cho bạn giá trị đặc biệt khoảng 0,8. Tuy nhiên, nó cao do FP lớn, thay vì TP lớn (Đúng dương).
Chẳng hạn như ví dụ dưới đây,
TP=155, FN=182
FP=84049, TN=34088
Vì vậy, khi bạn sử dụng AUC để đo hiệu suất của trình phân loại, vấn đề là sự gia tăng của AUC không thực sự phản ánh một trình phân loại tốt hơn. Đó chỉ là tác dụng phụ của quá nhiều ví dụ tiêu cực. Bạn chỉ có thể thử trong tập dữ liệu của bạn.
Fβ= ( 1 + β2) ⋅ p r e c i s i o n ⋅ r e c a l l( β2⋅ p r e c i s i o n ) + r e c a l l
β
Sau đó, đề xuất của tôi cho dữ liệu mất cân bằng tương tự như bài đăng này . Bạn cũng có thể thử bảng decile, có thể được xây dựng bằng cách tìm kiếm "Bảng phân loại hai và hai bảng phân tách". Trong khi đó, tôi cũng đang nghiên cứu về vấn đề này và sẽ đưa ra biện pháp tốt hơn.