Tôi muốn so sánh 2 phân loại khác nhau cho một vấn đề phân loại văn bản đa kính sử dụng các bộ dữ liệu đào tạo lớn. Tôi nghi ngờ liệu tôi nên sử dụng đường cong ROC hay học đường cong để so sánh 2 phân loại.
Một mặt, các đường cong học tập rất hữu ích cho việc quyết định kích thước của tập dữ liệu huấn luyện, vì bạn có thể tìm thấy kích thước của tập dữ liệu mà trình phân loại ngừng học (và có thể xuống cấp). Vì vậy, phân loại tốt nhất trong trường hợp này có thể là phân loại đạt độ chính xác cao nhất với kích thước tập dữ liệu nhỏ nhất.
Mặt khác, các đường cong ROC cho phép bạn tìm thấy một điểm với sự đánh đổi đúng giữa độ nhạy / độ đặc hiệu. Trình phân loại tốt nhất trong trường hợp này chỉ là phần gần với phần trên cùng bên trái, với TPR cao nhất cho bất kỳ FPR nào.
Tôi có nên sử dụng cả hai phương pháp đánh giá? Có thể cho một phương pháp có đường cong học tập tốt hơn để có đường cong ROC tồi tệ hơn và ngược lại?