Tôi nghĩ rằng bạn đang thiếu một cái gì đó vẫn còn trong sự hiểu biết của bạn về mục đích xác nhận chéo.
Chúng ta hãy hiểu một số thuật ngữ, nói chung khi chúng ta nói 'một mô hình', chúng ta đề cập đến một phương pháp cụ thể để mô tả cách một số dữ liệu đầu vào liên quan đến những gì chúng ta đang cố gắng dự đoán. Chúng tôi thường không coi các trường hợp cụ thể của phương pháp đó là các mô hình khác nhau. Vì vậy, bạn có thể nói 'Tôi có mô hình hồi quy tuyến tính' nhưng bạn sẽ không gọi hai bộ mô hình hệ số được đào tạo khác nhau. Ít nhất là không trong bối cảnh lựa chọn mô hình.
Vì vậy, khi bạn thực hiện xác thực chéo K-Fold, bạn đang kiểm tra xem mô hình của bạn có thể được đào tạo tốt như thế nào bởi một số dữ liệu và sau đó dự đoán dữ liệu mà nó chưa thấy. Chúng tôi sử dụng xác nhận chéo cho việc này vì nếu bạn đào tạo sử dụng tất cả dữ liệu bạn có, bạn không còn gì để kiểm tra. Bạn có thể làm điều này một lần, bằng cách sử dụng 80% dữ liệu để đào tạo và 20% để kiểm tra, nhưng nếu 20% bạn tình cờ chọn để kiểm tra thì có chứa một loạt các điểm đặc biệt dễ (hoặc đặc biệt khó) dự đoán? Chúng tôi sẽ không đưa ra ước tính tốt nhất có thể về khả năng tìm hiểu và dự đoán mô hình.
Chúng tôi muốn sử dụng tất cả các dữ liệu. Vì vậy, để tiếp tục ví dụ trên về phân tách 80/20, chúng tôi sẽ thực hiện xác nhận chéo 5 lần bằng cách đào tạo mô hình 5 lần trên 80% dữ liệu và thử nghiệm trên 20%. Chúng tôi đảm bảo rằng mỗi điểm dữ liệu kết thúc trong thử nghiệm 20% được đặt chính xác một lần. Do đó, chúng tôi đã sử dụng mọi điểm dữ liệu mà chúng tôi phải đóng góp để hiểu được mô hình của chúng tôi thực hiện tốt nhiệm vụ học hỏi từ một số dữ liệu và dự đoán một số dữ liệu mới như thế nào.
Nhưng mục đích của xác nhận chéo là không đưa ra mô hình cuối cùng của chúng tôi. Chúng tôi không sử dụng 5 trường hợp mô hình được đào tạo này để thực hiện bất kỳ dự đoán thực tế nào. Cho rằng chúng tôi muốn sử dụng tất cả các dữ liệu chúng tôi phải đưa ra mô hình tốt nhất có thể. Mục đích của xác nhận chéo là kiểm tra mô hình, không phải xây dựng mô hình.
Bây giờ, giả sử chúng ta có hai mô hình, giả sử mô hình hồi quy tuyến tính và mạng lưới thần kinh. Làm thế nào chúng ta có thể nói mô hình nào là tốt hơn? Chúng ta có thể xác thực chéo K-Fold và xem cái nào chứng minh tốt hơn trong việc dự đoán các điểm đặt thử nghiệm. Nhưng một khi chúng tôi đã sử dụng xác thực chéo để chọn mô hình hoạt động tốt hơn, chúng tôi huấn luyện mô hình đó (cho dù đó là hồi quy tuyến tính hay mạng thần kinh) trên tất cả dữ liệu. Chúng tôi không sử dụng các trường hợp mô hình thực tế mà chúng tôi đã đào tạo trong quá trình xác thực chéo cho mô hình dự đoán cuối cùng của chúng tôi.
Lưu ý rằng có một kỹ thuật gọi là tổng hợp bootstrap (thường được rút ngắn thành 'đóng bao') theo cách sử dụng các thể hiện mô hình được tạo theo cách tương tự như xác thực chéo để xây dựng mô hình tập hợp, nhưng đó là một kỹ thuật nâng cao ngoài phạm vi câu hỏi của bạn ở đây.