Đây là vấn đề.
Với thuật toán học mờ đục, bạn phải tìm hiểu xem thuật toán của bạn đã thực sự học được điều gì đó về cấu trúc sâu hơn phổ biến cho khu vực vấn đề mong muốn (giả sử có một số được tìm thấy), hoặc vừa học cách nhận ra một số đầu vào cụ thể và nhổ ra câu trả lời mong muốn chỉ dành cho những đầu vào đó (tương tự như học sinh chỉ "ghi nhớ bài kiểm tra" nhưng không có đầu mối nào khác). Cái sau không hữu ích lắm khi dữ liệu huấn luyện chỉ bao gồm một phần rất nhỏ của không gian vấn đề mong muốn.
Vì vậy, để tìm hiểu, bạn huấn luyện thuật toán của mình trên một bộ dữ liệu cho đến khi nó đưa ra câu trả lời đúng. Sau đó, bạn thay đổi đầu vào thành một số dữ liệu thử nghiệm khác nhau mà thuật toán được đào tạo chưa từng thấy trước đây và xem liệu nó vẫn có thể cung cấp cho bạn câu trả lời hữu ích hay chỉ thực sự hiệu quả đối với những thứ duy nhất trong tập huấn luyện ban đầu. Đó là tập dữ liệu thử nghiệm.
Nếu bạn có dữ liệu trong thế giới thực, việc chia thành hai tập khác nhau và không để thuật toán nhìn thấy tập kiểm tra trong quá trình đào tạo là điều phổ biến. Tương tự như việc giáo viên khóa các câu hỏi cho đến khi kết thúc học kỳ.