Tôi có một nhiệm vụ khai thác dữ liệu nơi tôi thực hiện một hệ thống truy xuất hình ảnh dựa trên nội dung. Tôi có 20 hình ảnh của 5 con vật. Vì vậy, trong tổng số 100 hình ảnh.
Hệ thống của tôi trả về 10 hình ảnh phù hợp nhất với hình ảnh đầu vào. Bây giờ tôi cần đánh giá hiệu năng của hệ thống của mình bằng đường cong Precision-Recall. Tuy nhiên, tôi không hiểu khái niệm đường cong Chính xác-Nhớ lại. Giả sử hệ thống của tôi trả về 10 hình ảnh cho một hình ảnh khỉ đột, nhưng chỉ có 4 trong số đó là khỉ đột. 6 hình ảnh khác được trả lại là các động vật khác '. Như vậy
- độ chính xác là
4/10 = 0.4
(trả lại liên quan) / (tất cả trả lại) - gọi lại là
4/20 = 0.2
(trả lại liên quan) / (tất cả các liên quan)
Vì vậy, tôi chỉ có một điểm <0.2,0.4>
, không phải là một đường cong. Làm thế nào để tôi có một đường cong (nghĩa là một tập hợp các điểm)? Tôi có nên thay đổi số lượng hình ảnh được trả lại (điều này được cố định ở mức 10 trong trường hợp của tôi)?