Trong khi hai biện pháp thống kê có khả năng tương quan với nhau, chúng đo lường các phẩm chất khác nhau của phân loại.
AUROC
Vùng bên dưới đường cong (AUC) bằng với xác suất phân loại sẽ xếp hạng một trường hợp tích cực được chọn ngẫu nhiên cao hơn một ví dụ tiêu cực được chọn ngẫu nhiên. Nó đo kỹ năng phân loại trong việc xếp hạng một tập các mẫu theo mức độ mà chúng thuộc về lớp tích cực, nhưng không thực sự gán các mẫu cho các lớp.
Độ chính xác tổng thể cũng phụ thuộc vào khả năng của trình phân loại để xếp hạng các mẫu, nhưng cũng phụ thuộc vào khả năng chọn ngưỡng trong xếp hạng được sử dụng để gán các mẫu cho lớp dương nếu ở trên ngưỡng và cho lớp âm nếu ở dưới.
Do đó, bộ phân loại có thống kê AUROC cao hơn (tất cả mọi thứ đều bằng nhau) có khả năng cũng có độ chính xác tổng thể cao hơn vì xếp hạng các mẫu (mà AUROC đo lường) có lợi cho cả AUROC và độ chính xác tổng thể. Tuy nhiên, nếu một trình phân loại xếp hạng các mẫu tốt, nhưng chọn ngưỡng không tốt, thì nó có thể có AUROC cao nhưng độ chính xác tổng thể kém.
Công dụng thực tế
Trong thực tế, tôi muốn thu thập độ chính xác tổng thể, AUROC và nếu trình phân loại ước tính xác suất thành viên của lớp, thông tin liên kết chéo hoặc thông tin dự đoán. Sau đó, tôi có một số liệu đo khả năng thô của nó để thực hiện phân loại cứng (giả sử chi phí phân loại sai âm tính dương và giả là bằng nhau và tần số lớp trong mẫu giống như trong sử dụng vận hành - một giả định lớn!), một số liệu đo lường khả năng xếp hạng các mẫu và một số liệu đo lường mức độ xếp hạng được hiệu chuẩn như một xác suất.
Đối với nhiều tác vụ, chi phí phân loại sai hoạt động là không xác định hoặc thay đổi hoặc tần số của lớp hoạt động khác với tần suất trong mẫu đào tạo hoặc là biến. Trong trường hợp đó, độ chính xác tổng thể thường khá vô nghĩa và AUROC là một chỉ số hiệu suất tốt hơn và lý tưởng là chúng tôi muốn một bộ phân loại đưa ra các xác suất được hiệu chỉnh tốt, để chúng tôi có thể bù cho các vấn đề này trong sử dụng vận hành. Về cơ bản, số liệu nào là quan trọng phụ thuộc vào vấn đề chúng tôi đang cố gắng giải quyết.