Được
- một tập dữ liệu với các thể hiện cùng với N lớp trong đó mọi trường hợp x i thuộc chính xác một lớp y i
- một bộ phân loại đa lớp
Sau khi đào tạo và kiểm tra, về cơ bản tôi có một bảng với lớp đúng và lớp dự đoán a i cho mọi trường hợp x i trong tập kiểm tra. Vì vậy, cho mọi trường hợp tôi có một trong hai trận đấu ( y i = một i ) hoặc bỏ lỡ ( y i ≠ một i ).
Làm thế nào tôi có thể đánh giá chất lượng của trận đấu? Vấn đề là một số lớp có thể có nhiều thành viên, tức là nhiều trường hợp thuộc về nó. Rõ ràng nếu 50% của tất cả các điểm dữ liệu thuộc về một lớp và phân loại cuối cùng của tôi là 50% tổng thể, tôi không thu được gì. Tôi cũng có thể tạo ra một bộ phân loại tầm thường tạo ra lớp lớn nhất cho dù đầu vào là gì.
Có một phương pháp tiêu chuẩn để ước tính chất lượng của một bộ phân loại dựa trên kết quả thử nghiệm đã biết của các kết quả trùng khớp và số lần truy cập cho mỗi lớp không? Có lẽ điều quan trọng là phải phân biệt tỷ lệ phù hợp cho từng loại cụ thể?
Cách tiếp cận đơn giản nhất tôi có thể nghĩ đến là loại trừ các trận đấu chính xác của lớp lớn nhất. Còn gì nữa không