Lý do sử dụng AUC?


10

Đặc biệt ở khía cạnh định hướng khoa học máy tính của tài liệu học máy, AUC (khu vực dưới đường cong đặc tính toán tử máy thu) là một tiêu chí phổ biến để đánh giá các phân loại. Các biện minh cho việc sử dụng AUC là gì? Ví dụ, có một hàm mất cụ thể nào mà quyết định tối ưu là phân loại có AUC tốt nhất không?


1
AUC là một hàm mất, rõ ràng là đối với hàm mất này, quyết định tối ưu là phân loại có AUC tốt nhất.
cướp girard

1
@robingirard Không, không, vì nó không khác biệt, tức là bạn không thể tối ưu hóa trực tiếp.
cpury

Câu trả lời:


15

CeC(e)[0,1]C(e1)>C(e0)e1e0C(e0)C(e1)


0

Chúng ta hãy lấy một ví dụ đơn giản để xác định cà chua tốt từ một nhóm cà chua tốt + xấu. Giả sử số lượng cà chua tốt là 100, và cà chua xấu là 1000, vì vậy tổng cộng là 1100. Bây giờ công việc của bạn là xác định càng nhiều cà chua tốt càng tốt. Một cách để có được tất cả cà chua tốt là lấy tất cả 1100 cà chua. Nhưng nó rõ ràng nói rằng bạn không thể phân biệt b / n tốt và xấu .

Vì vậy, cách phân biệt đúng đắn là gì - cần phải có được nhiều cái tốt trong khi chọn ra rất ít cái xấu , vì vậy chúng ta cần một thước đo, có thể nói có bao nhiêu cái tốt chúng ta nhặt được và cũng nói những cái xấu được tính vào nó Biện pháp AUC mang lại nhiều trọng lượng hơn nếu nó có thể chọn nhiều cái tốt hơn với một vài cái xấu như được mô tả dưới đây. trong đó nói mức độ tốt của bạn có thể phân biệt b / n tốt và xấu.

Trong ví dụ bạn có thể quan sát thấy rằng trong khi nhặt 70% cà chua tốt, đường cong màu đen đã nhặt được khoảng 48% của quả xấu (tạp chất), nhưng màu xanh có 83% là xấu (tạp chất). Vì vậy, đường cong màu đen có điểm AUC tốt hơn so với màu xanh. nhập mô tả hình ảnh ở đây


Làm thế nào để trả lời câu hỏi này?
Vivek Subramanian

Tôi đã viết với trực giác của AUC rằng, nó giúp cho điểm số duy nhất để xác định điểm tốt (1 trong phân loại nhị phân) trong toàn bộ dân số trong khi giảm số lượng dương tính giả. Giúp tôi làm thế nào tôi có thể làm tốt hơn cho việc này.
yugandhar
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.