Câu hỏi khá mơ hồ vì vậy tôi sẽ giả định rằng bạn muốn chọn một thước đo hiệu suất phù hợp để so sánh các mô hình khác nhau. Để có cái nhìn tổng quan về sự khác biệt chính giữa các đường cong ROC và PR, bạn có thể tham khảo bài viết sau: Mối quan hệ giữa đường cong chính xác-thu hồi và đường cong ROC của Davis và Goadrich .
Để trích dẫn Davis và Goadrich:
Tuy nhiên, khi xử lý các bộ dữ liệu bị sai lệch, các đường cong Chính xác-Thu hồi (PR) đưa ra một bức tranh nhiều thông tin hơn về hiệu suất của thuật toán.
ROC vẽ đồ thị FPR vs TPR. Để rõ ràng hơn:
PR đường cong độ chính xác của âm mưu so với thu hồi (FPR) hoặc rõ ràng hơn:
recall=TP
FPR = FPFP+ TN,TPR = TPTP+ FN.
r e c a l l = TPTP+ FN= TPR ,p r e c i s i o n = TPTP+ FP
Độ chính xác bị ảnh hưởng trực tiếp bởi cân bằng lớp (im) do bị ảnh hưởng, trong khi TPR chỉ phụ thuộc vào dương. Đây là lý do tại sao các đường cong ROC không thu được các hiệu ứng như vậy.FP
Đường cong thu hồi chính xác là tốt hơn để làm nổi bật sự khác biệt giữa các mô hình cho các tập dữ liệu mất cân bằng cao. Nếu bạn muốn so sánh các mô hình khác nhau trong cài đặt mất cân bằng, khu vực dưới đường cong PR có thể sẽ thể hiện sự khác biệt lớn hơn so với khu vực dưới đường cong ROC.
Điều đó nói rằng, các đường cong ROC là phổ biến hơn nhiều (ngay cả khi chúng không phù hợp). Tùy thuộc vào đối tượng của bạn, các đường cong ROC có thể là ngôn ngữ chung vì vậy sử dụng chúng có lẽ là sự lựa chọn an toàn hơn. Nếu một mô hình hoàn toàn thống trị một mô hình khác trong không gian PR (ví dụ: luôn có độ chính xác cao hơn toàn bộ phạm vi thu hồi), thì mô hình đó cũng sẽ chiếm ưu thế trong không gian ROC. Nếu các đường cong giao nhau trong một trong hai không gian, chúng cũng sẽ giao nhau trong không gian khác. Nói cách khác, các kết luận chính sẽ tương tự cho dù bạn sử dụng đường cong nào.
Quảng cáo không biết xấu hổ . Một ví dụ khác, bạn có thể xem một trong những bài báo của tôi trong đó tôi báo cáo cả hai đường cong ROC và PR trong một thiết lập không cân bằng. Hình 3 chứa các đường cong ROC và PR cho các mô hình giống hệt nhau, cho thấy rõ sự khác biệt giữa hai mô hình. Để so sánh khu vực theo PR với khu vực theo ROC, bạn có thể so sánh các bảng 1-2 (AUPR) và bảng 3-4 (AUROC) trong đó bạn có thể thấy rằng AUPR cho thấy sự khác biệt lớn hơn nhiều giữa các mô hình riêng lẻ so với AUROC. Điều này nhấn mạnh sự phù hợp của các đường cong PR một lần nữa.