Tôi làm việc trong một lĩnh vực có vấn đề nơi mọi người thường báo cáo ROC-AUC hoặc AveP (độ chính xác trung bình). Tuy nhiên, gần đây tôi đã tìm thấy các bài báo tối ưu hóa Mất Log thay vào đó, trong khi những người khác báo cáo Mất bản lề .
Trong khi tôi hiểu cách tính các số liệu này, tôi gặp khó khăn trong việc hiểu sự đánh đổi giữa chúng và điều này tốt cho chính xác những gì.
Khi nói đến ROC-AUC vs độ chính xác cao Nhớ lại, chủ đề này thảo luận cách ROC-AUC-tối đa hóa có thể được coi là sử dụng một tiêu chí tối ưu hóa mất mát để gây bất lợi "bảng xếp hạng âm đúng ít nhất lớn như một dương true" (giả định rằng cao điểm tương ứng với dương tính). Ngoài ra, chủ đề khác này cũng cung cấp một cuộc thảo luận hữu ích về ROC-AUC trái ngược với các số liệu Chính xác-Nhớ lại .
Tuy nhiên, đối với loại vấn đề nào thì mất log sẽ được ưu tiên hơn, giả sử, ROC-AUC , AveP hoặc mất bản lề ? Quan trọng nhất, loại câu hỏi nào người ta nên hỏi về vấn đề khi lựa chọn giữa các hàm mất mát này để phân loại nhị phân?