Tôi muốn so sánh hai thuật toán xếp hạng. Trong các thuật toán này, khách hàng chỉ định một số điều kiện trong tìm kiếm của mình. Theo yêu cầu của khách hàng, các thuật toán này sẽ chỉ định điểm cho từng mục trong cơ sở dữ liệu và truy xuất các mục có điểm cao nhất.
Tôi đã đọc các chủ đề khác nhau liên quan đến câu hỏi của tôi trong trang web này và tìm kiếm trên mạng. Theo các tìm kiếm của tôi, bài viết phù hợp nhất giải thích về một số số liệu để so sánh các thuật toán xếp hạng, là: Brian McFee và Gert RG Lanckriet, Số liệu học để xếp hạng, ICML 2010 ( https://bmcfee.github.io/ con / mlr .pdf ). Tôi nghĩ pre @ k, MAP, MRR và NDCG, là những số liệu tốt để sử dụng, nhưng tôi có một vấn đề:
Thuật toán của tôi sắp xếp kết quả, vì vậy mục đầu tiên trong danh sách kết quả của tôi là mục tốt nhất có điểm cao nhất, kết quả thứ hai có điểm cao thứ hai, v.v. Tôi giới hạn thuật toán tìm kiếm của tôi, ví dụ như tìm 5 kết quả tốt nhất. Kết quả là 5 mục hàng đầu nhất. Vì vậy, độ chính xác sẽ là 1. Khi tôi giới hạn tìm kiếm của mình để tìm kết quả tốt nhất, Nó sẽ tìm thấy kết quả tốt nhất. Một lần nữa, độ chính xác sẽ là 1. Nhưng vấn đề là ở chỗ, không thể chấp nhận được đối với những người nhìn thấy kết quả này.
Tôi có thể làm gì? Làm thế nào tôi có thể so sánh các thuật toán này và hiển thị một thuật toán tốt hơn thuật toán kia?