Câu trả lời:
Tỷ lệ được phân loại chính xác là một quy tắc chấm điểm không phù hợp, nghĩa là, nó được tối ưu hóa bởi một mô hình không có thật. Tôi sẽ sử dụng quy tắc chấm điểm thích hợp bậc hai được gọi là điểm Brier hoặc xác suất phù hợp (khu vực dưới đường cong ROC trong trường hợp nhị phân ). Rừng ngẫu nhiên hoạt động tốt hơn SVM trong trường hợp của bạn.
Tôi nghĩ bạn chắc chắn nên xem xét nhiều số liệu hơn là AUC và độ chính xác.
Độ chính xác (cùng với độ nhạy và độ đặc hiệu) là một số liệu rất đơn giản nhưng sai lệch buộc bạn phải xem kết quả dự đoán tuyệt đối và không mở để xác nhận xác suất hoặc xếp hạng của lớp. Nó cũng không tính đến dân số mà mời giải thích sai như một mô hình mang lại độ chính xác 95% cho dân số với 95% cơ hội đúng một cách ngẫu nhiên không thực sự là một mô hình tốt, ngay cả khi độ chính xác cao.
AUC là một số liệu tốt để khẳng định độ chính xác của mô hình độc lập với xác suất của lớp dân số. Tuy nhiên, nó sẽ không cho bạn biết bất cứ điều gì về ước tính xác suất thực sự tốt như thế nào. Bạn có thể nhận được AUC cao nhưng vẫn có ước tính xác suất rất sai lệch. Số liệu này phân biệt đối xử nhiều hơn độ chính xác và chắc chắn sẽ cung cấp cho bạn các mô hình tốt hơn khi được sử dụng kết hợp với một số quy tắc chấm điểm thích hợp, ví dụ: điểm Brier như được đề cập trong bài đăng khác.
Bạn có thể có được một bằng chứng chính thức hơn ở đây, mặc dù bài viết này khá lý thuyết: AUC: Một biện pháp thống nhất và thống nhất hơn so với độ chính xác
Tuy nhiên, có một loạt các số liệu tốt có sẵn. Các hàm mất cho ước tính xác suất và phân loại xác suất của lớp nhị phân: Cấu trúc và ứng dụng là một bài viết tốt để đầu tư các quy tắc chấm điểm thích hợp như điểm Brier.
Một bài báo thú vị khác với các số liệu để khẳng định hiệu suất mô hình là Đánh giá: từ độ chính xác, thu hồi và đo F đến ROC, thông tin, đánh dấu & tương quan chiếm các số liệu hiệu suất tốt khác như thông tin.
Để tóm tắt, tôi khuyên bạn nên xem điểm AUC / Gini và Brier để khẳng định hiệu suất mô hình của bạn, nhưng tùy thuộc vào mục tiêu với mô hình của bạn, các số liệu khác có thể phù hợp với vấn đề của bạn hơn.