Để tạo các đường cong ROC (= Đường cong đặc tính hoạt động của người nhận):
Giả sử chúng ta có một phân loại xác suất, nhị phân như hồi quy logistic. Trước khi trình bày đường cong ROC, phải hiểu khái niệm ma trận nhầm lẫn . Khi chúng tôi thực hiện dự đoán nhị phân, có thể có 4 loại lỗi:
- Chúng ta dự đoán 0 trong khi chúng ta nên có lớp thực sự là 0: đây được gọi là Phủ định thực , tức là chúng ta dự đoán chính xác rằng lớp đó là âm (0). Ví dụ, một chương trình chống vi-rút không phát hiện tệp vô hại là vi-rút.
- Chúng tôi dự đoán 0 trong khi chúng ta nên có lớp thực sự là 1: đây được gọi là Sai âm , tức là chúng ta dự đoán không chính xác rằng lớp đó là âm (0). Ví dụ, một chương trình chống vi-rút không phát hiện ra vi-rút.
- Chúng ta dự đoán 1 trong khi chúng ta nên có lớp thực sự là 0: đây được gọi là Sai dương , tức là chúng ta dự đoán không chính xác rằng lớp đó là dương (1). Ví dụ, một chương trình chống vi-rút coi một tệp vô hại là vi-rút.
- Chúng ta dự đoán 1 trong khi chúng ta nên có lớp thực sự là 1: đây được gọi là True thật , tức là chúng ta dự đoán chính xác rằng lớp đó là dương (1). Ví dụ, một chương trình chống vi-rút đã phát hiện đúng vi-rút.
Để có được ma trận nhầm lẫn, chúng tôi xem xét tất cả các dự đoán được đưa ra bởi mô hình và tính xem có bao nhiêu lần trong số 4 loại lỗi đó xảy ra:
Trong ví dụ này về ma trận nhầm lẫn, trong số 50 điểm dữ liệu được phân loại, 45 điểm được phân loại chính xác và 5 điểm được phân loại sai.
Vì để so sánh hai mô hình khác nhau, sẽ thuận tiện hơn khi có một số liệu đơn lẻ hơn là một số liệu, chúng tôi tính hai số liệu từ ma trận nhầm lẫn, sau này chúng tôi sẽ kết hợp thành một:
- TPTP+ FN
- FPFP+ TN
0,00 ; 0.01 , 0.02 , ... , 1.00
Trong hình này, vùng màu xanh lam tương ứng với Vùng bên dưới đường cong của Đặc tính vận hành máy thu (AUROC). Đường đứt nét trong đường chéo chúng tôi trình bày đường cong ROC của một yếu tố dự đoán ngẫu nhiên: nó có AUROC là 0,5. Công cụ dự đoán ngẫu nhiên thường được sử dụng làm đường cơ sở để xem liệu mô hình có hữu ích hay không.
Nếu bạn muốn có được một số kinh nghiệm trực tiếp: