Tôi đã đọc về xác nhận k-Fold và tôi muốn chắc chắn rằng tôi hiểu cách thức hoạt động của nó.
Tôi biết rằng đối với phương pháp giữ, dữ liệu được chia thành ba bộ và bộ kiểm tra chỉ được sử dụng ở cuối để đánh giá hiệu suất của mô hình, trong khi bộ xác thực được sử dụng để điều chỉnh siêu âm, v.v.
Trong phương pháp gấp k, chúng ta vẫn giữ một bộ kiểm tra cho cuối cùng và chỉ sử dụng dữ liệu còn lại để đào tạo và điều chỉnh siêu tham số, tức là chúng ta chia dữ liệu còn lại thành k nếp gấp, sau đó sử dụng độ chính xác trung bình sau khi đào tạo với mỗi lần gấp (hoặc bất kỳ số liệu hiệu suất nào chúng tôi chọn để điều chỉnh siêu âm của chúng tôi)? Hoặc chúng ta hoàn toàn không sử dụng một bộ kiểm tra riêng biệt và chỉ chia toàn bộ tập dữ liệu thành k nếp gấp (nếu đây là trường hợp, tôi giả sử rằng chúng ta chỉ coi độ chính xác trung bình trên các nếp gấp k là độ chính xác cuối cùng của chúng ta)?