Câu hỏi thực sự tuyệt vời, và một câu hỏi mà tôi thấy rằng hầu hết mọi người không thực sự hiểu ở mức độ trực quan. AUC
trong thực tế thường được ưa thích hơn độ chính xác để phân loại nhị phân vì một số lý do khác nhau. Trước hết, hãy nói về chính xác những gì AUC
. Thành thật mà nói, vì là một trong những thước đo hiệu quả được sử dụng rộng rãi nhất, thật đáng ngạc nhiên khi tìm hiểu chính xác cách thức AUC
hoạt động.
AUC
là viết tắt của Area Under the Curve
, đường cong nào bạn yêu cầu? Vâng, đó sẽ là ROC
đường cong. ROC
là viết tắt của đặc tính hoạt động của người nhận , thực ra hơi không trực quan. Mục tiêu ngầm định AUC
là xử lý các tình huống trong đó bạn có phân phối mẫu rất sai lệch và không muốn phù hợp với một lớp duy nhất.
Một ví dụ tuyệt vời là trong phát hiện thư rác. Nói chung, các bộ dữ liệu thư rác thiên về MẠNH hoặc không phải là thư rác. Nếu bộ dữ liệu của bạn là 90% ham, bạn có thể có được độ chính xác khá tốt bằng cách chỉ nói rằng mỗi email đều bị ham, đó rõ ràng là thứ chỉ ra một bộ phân loại không lý tưởng. Hãy bắt đầu với một vài số liệu hữu ích hơn một chút cho chúng tôi, cụ thể là tỷ lệ dương thực sự ( TPR
) và tỷ lệ dương tính giả ( FPR
):
Bây giờ trong biểu đồ này, TPR
cụ thể là tỷ lệ dương thực sự với tất cả các dương, và FPR
là tỷ lệ dương tính giả với tất cả các phủ định. (Hãy nhớ rằng, điều này chỉ dành cho phân loại nhị phân.) Trên một biểu đồ như thế này, sẽ khá đơn giản để tìm ra rằng dự đoán của tất cả 0 hoặc tất cả 1 sẽ dẫn đến các điểm (0,0)
và (1,1)
tương ứng. Nếu bạn vẽ một dòng qua những dòng này, bạn sẽ nhận được một cái gì đó như thế này:
Về cơ bản trông giống như một đường chéo (nó là), và bằng một số hình học dễ dàng, bạn có thể thấy rằng AUC
mô hình như vậy sẽ là 0.5
(chiều cao và cơ sở đều là 1). Tương tự, nếu bạn dự đoán một loại ngẫu nhiên là 0 và 1, giả sử 90% 1, bạn có thể nhận được điểm (0.9, 0.9)
, một lần nữa rơi dọc theo đường chéo đó.
Bây giờ đến phần thú vị. Điều gì xảy ra nếu chúng ta không chỉ dự đoán 0 và 1? Điều gì sẽ xảy ra nếu thay vào đó, chúng tôi muốn nói rằng, về mặt lý thuyết, chúng tôi sẽ thiết lập một điểm cắt, trên đó mọi kết quả là 1 và dưới đó mọi kết quả là 0. Điều này có nghĩa là ở thái cực bạn sẽ gặp tình huống ban đầu khi bạn có tất cả 0 và tất cả 1 (ở mức cắt 0 và 1 tương ứng), nhưng cũng có một loạt các trạng thái trung gian nằm trong 1x1
biểu đồ chứa của bạn ROC
. Trong thực tế, bạn nhận được một cái gì đó như thế này:
Về cơ bản, những gì bạn thực sự nhận được khi bạn làm AUC
quá chính xác là điều sẽ khiến mọi người không khuyến khích những người mẫu đại diện, nhưng không phân biệt đối xử, vì điều này sẽ chỉ thực sự chọn những mô hình đạt được tỷ lệ dương và sai thực sự mà là đáng kể trên cơ hội ngẫu nhiên, không được đảm bảo cho độ chính xác.