Tôi đã suy nghĩ lại về một câu trả lời tôi đã đưa ra cho một câu hỏi vài tuần trước
Xác thực chéo giữ lại tạo ra một bộ thử nghiệm duy nhất có thể được sử dụng nhiều lần để trình diễn. Tất cả chúng ta dường như đồng ý rằng đây là một tính năng tiêu cực theo nhiều cách, vì một bộ được tổ chức có thể trở thành không đại diện thông qua tính ngẫu nhiên. Hơn nữa, bạn có thể kết thúc quá mức với dữ liệu thử nghiệm giống như cách bạn có thể phù hợp với dữ liệu đào tạo.
Tuy nhiên, đối với tôi, bản chất tĩnh của một mẫu được tổ chức là một xấp xỉ tốt hơn của việc "lấy nhiều dữ liệu" hơn so với CV gấp và tránh vấn đề tính trung bình trên các nếp gấp. Tuy nhiên, tôi không thể đưa ra bất kỳ cơ sở thống kê nào cho cảm giác này. Có logic nào trong trực giác của tôi không?
Ví dụ, những gì tôi có trong đầu cho một dự án sắp tới trước tiên là sử dụng xác thực giữ để xây dựng và kiểm tra một mô hình, sau đó là một bước xác thực vẽ lại thiết lập giữ lại nhiều lần để cho thấy rằng các ước tính của tôi về lỗi dự đoán ( trên bộ kiểm tra) rất mạnh để lấy mẫu lỗi trong bộ kiểm tra. Đây có phải là một ý tưởng tồi cho bất kỳ lý do? Câu hỏi này đã được hỏi trước đây nhưng không bao giờ nhận được câu trả lời.