Tôi có một câu hỏi liên quan đến quá trình xác nhận chéo. Tôi đang ở giữa một khóa học về Machine Learning trên Cursera. Một trong những chủ đề là về xác thực chéo. Tôi thấy nó hơi khó theo dõi. Tôi biết lý do tại sao chúng tôi cần CV vì chúng tôi muốn các mô hình của chúng tôi hoạt động tốt trên dữ liệu (chưa biết) trong tương lai và CV ngăn không cho quá nhiều. Tuy nhiên, quá trình tự nó là khó hiểu.
Điều tôi đã hiểu là tôi chia dữ liệu thành 3 tập con: đào tạo, xác nhận và kiểm tra. Đào tạo và xác nhận là để tìm độ phức tạp tối ưu của một mô hình. Những gì tôi không hiểu là tập hợp con thứ ba. Tôi hiểu rằng tôi có một số tính năng cho mô hình, huấn luyện nó và xác thực nó trên tập hợp con Xác thực và tìm kiếm Hàm chi phí tối thiểu khi tôi thay đổi cấu trúc. Khi tôi tìm thấy nó, tôi kiểm tra mô hình trên tập hợp con Test. Nếu tôi đã tìm thấy Hàm chi phí tối thiểu trên tập hợp con Xác thực, tại sao tôi lại cần kiểm tra lại nó trong tập hợp con Thử nghiệm ???
Ai đó có thể xin vui lòng làm rõ điều này cho tôi?
Cảm ơn bạn