Có nhiều tình huống bạn có thể huấn luyện một số phân loại khác nhau hoặc sử dụng một số phương pháp trích xuất tính năng khác nhau. Trong các tài liệu, các tác giả thường đưa ra lỗi phân loại trung bình đối với một tập hợp các phân chia ngẫu nhiên của dữ liệu (nghĩa là sau khi xác thực chéo được lồng đôi), và đôi khi cũng đưa ra các phương sai về lỗi trên các phần tách. Tuy nhiên, điều này tự nó không đủ để nói rằng một phân loại tốt hơn đáng kể so với phân loại khác. Tôi đã thấy nhiều cách tiếp cận khác nhau - sử dụng các bài kiểm tra Chi bình phương, kiểm tra t, ANOVA với kiểm tra sau đại học, v.v.
Phương pháp nào nên được sử dụng để xác định ý nghĩa thống kê? Đặt câu hỏi đó là: Chúng ta nên đưa ra giả định gì về phân phối điểm số phân loại?