Tôi thường thấy mọi người nói về xác nhận chéo 5x2 là một trường hợp đặc biệt của xác thực chéo lồng nhau .
Tôi giả sử số thứ nhất (ở đây: 5) đề cập đến số lần gấp trong vòng lặp bên trong và số thứ hai (ở đây: 2) đề cập đến số lần trong vòng ngoài? Vì vậy, điều này khác với cách tiếp cận lựa chọn và đánh giá mô hình "truyền thống" như thế nào? Theo "truyền thống", ý tôi là
- chia tập dữ liệu thành một khóa đào tạo riêng (ví dụ: 80%) và tập kiểm tra
- sử dụng xác thực chéo k-Fold (ví dụ: k = 10) để điều chỉnh siêu tham số và lựa chọn mô hình trên tập huấn luyện
- đánh giá hiệu suất tổng quát hóa của mô hình đã chọn bằng cách sử dụng bộ kiểm tra
Không phải 5x2 giống hệt nhau ngoại trừ tập kiểm tra và huấn luyện có kích thước bằng nhau nếu k = 2?