Xác thực chéo một lần thường không dẫn đến hiệu suất tốt hơn so với K-Fold và có nhiều khả năng tệ hơn , vì nó có phương sai tương đối cao (nghĩa là giá trị của nó thay đổi nhiều hơn đối với các mẫu dữ liệu khác nhau so với giá trị cho xác nhận chéo k-gấp). Điều này không tốt trong tiêu chí lựa chọn mô hình vì nó có nghĩa là tiêu chí lựa chọn mô hình có thể được tối ưu hóa theo cách chỉ khai thác biến thể ngẫu nhiên trong mẫu dữ liệu cụ thể, thay vì thực hiện các cải tiến chính xác về hiệu suất, nghĩa là bạn có nhiều khả năng phù hợp hơn tiêu chí lựa chọn mô hình. Lý do xác thực chéo một lần được sử dụng trong thực tế là đối với nhiều mô hình, nó có thể được đánh giá rất rẻ như một sản phẩm phụ của việc lắp mô hình.
Nếu chi phí tính toán không phải là vấn đề chủ yếu, thì cách tiếp cận tốt hơn là thực hiện xác nhận chéo k-lặp lại, trong đó quy trình xác thực chéo k-lặp được lặp lại với các phân vùng ngẫu nhiên khác nhau thành các tập con k rời nhau mỗi lần. Điều này làm giảm phương sai.
Nếu bạn chỉ có 20 mẫu, rất có thể bạn sẽ gặp phải sự phù hợp với tiêu chí lựa chọn mô hình, đó là một cạm bẫy bị lãng quên nhiều trong thống kê và học máy (phích cắm không biết xấu hổ: xem bài viết của tôi về chủ đề này). Bạn có thể tốt hơn nên chọn một mô hình tương đối đơn giản và cố gắng không tối ưu hóa nó rất tích cực, hoặc áp dụng cách tiếp cận Bayes và trung bình trên tất cả các lựa chọn mô hình, được cân nhắc bởi tính hợp lý của chúng. Tối ưu hóa IMHO là gốc rễ của mọi tội lỗi trong thống kê, vì vậy tốt hơn hết là không tối ưu hóa nếu bạn không phải và tối ưu hóa một cách thận trọng bất cứ khi nào bạn làm.
Cũng lưu ý nếu bạn định thực hiện lựa chọn mô hình, bạn cần sử dụng một cái gì đó như xác thực chéo lồng nhau nếu bạn cũng cần một ước tính hiệu suất (nghĩa là bạn cần xem xét lựa chọn mô hình như một phần không thể thiếu của quy trình khớp mô hình và xác thực chéo cũng).