Các cuộc thi Kaggle xác định thứ hạng cuối cùng dựa trên một bộ thử nghiệm được tổ chức.
Một bộ kiểm tra tổ chức là một mẫu; nó có thể không đại diện cho dân số được mô hình hóa. Vì mỗi bài nộp giống như một giả thuyết, thuật toán giành chiến thắng trong cuộc thi có thể, cuối cùng, có thể kết thúc phù hợp với tập kiểm tra tốt hơn các bài kiểm tra khác. Nói cách khác, nếu một bộ thử nghiệm khác được chọn và cuộc thi lặp lại, liệu thứ hạng có giữ nguyên không?
Đối với tập đoàn tài trợ, điều này không thực sự quan trọng (có lẽ 20 bài nộp hàng đầu sẽ cải thiện đường cơ sở của họ). Mặc dù, trớ trêu thay, cuối cùng họ có thể sử dụng một mô hình được xếp hạng đầu tiên tệ hơn so với năm mô hình hàng đầu khác. Nhưng, đối với những người tham gia cuộc thi, có vẻ như Kaggle cuối cùng là một trò chơi may rủi - may mắn không cần phải vấp phải giải pháp đúng đắn, cần phải vấp ngã vào một thử thách phù hợp với bộ thử nghiệm!
Có thể thay đổi cuộc thi để tất cả các đội hàng đầu không thể thống kê chiến thắng? Hoặc, trong nhóm này, mô hình giá rẻ nhất hoặc tính toán nhất có thể giành chiến thắng?