Mặc dù kết quả của bộ thử nghiệm riêng không thể được sử dụng để tinh chỉnh mô hình hơn nữa, nhưng không phải lựa chọn mô hình trong số lượng lớn các mô hình đang được thực hiện dựa trên kết quả của thử nghiệm riêng? Bạn sẽ không, thông qua quá trình đó một mình, kết thúc quá mức cho bộ thử nghiệm riêng tư?
Theo "Giả thuyết toán học và tài chính giả: Tác động của việc vượt quá mức hiệu quả đối với hoạt động ngoài mẫu" của Bailey et.al. tương đối dễ dàng để "overfit" khi chọn tốt nhất trong số lượng lớn các mô hình được đánh giá trên cùng một tập dữ liệu. Điều đó không xảy ra với bảng xếp hạng riêng của Kaggle?
- Các biện minh thống kê cho các mô hình hoạt động tốt nhất trên bảng xếp hạng riêng là các mô hình tổng quát hóa dữ liệu ngoài mẫu tốt nhất là gì?
- Các công ty thực sự kết thúc bằng cách sử dụng các mô hình chiến thắng, hay là bảng xếp hạng tư nhân ở đó chỉ để cung cấp "luật chơi", và các công ty thực sự quan tâm nhiều hơn đến cái nhìn sâu sắc nảy sinh từ cuộc thảo luận về vấn đề này?