Tôi muốn so sánh độ chính xác của hai phân loại cho ý nghĩa thống kê. Cả hai phân loại được chạy trên cùng một tập dữ liệu. Điều này khiến tôi tin rằng tôi nên sử dụng một bài kiểm tra mẫu từ những gì tôi đã đọc .
Ví dụ:
Classifier 1: 51% accuracy
Classifier 2: 64% accuracy
Dataset size: 78,000
Đây có phải là thử nghiệm đúng để sử dụng? Nếu vậy làm thế nào để tôi tính toán nếu sự khác biệt về độ chính xác giữa phân loại là đáng kể?
Hay tôi nên sử dụng một bài kiểm tra khác?