Phương án 1 là phương án đúng. Bạn có thể thêm bộ dữ liệu xác nhận để cập nhật các tham số của mô hình.
Đó là câu trả lời. Bây giờ hãy để chúng tôi thảo luận về nó. Thực tế là những gì bạn đã làm là tùy chọn 1. ở trên sẽ rõ ràng hơn nếu bạn thực hiện xác thực chéo gấp đôi của bootstrapping (và bạn nên làm điều đó - không rõ ràng từ câu hỏi của bạn).
Trong 5 lần xác thực chéo, bạn chia dữ liệu bạn có thành 5 bộ ngẫu nhiên có kích thước bằng nhau. Hãy để chúng tôi gọi chúng là A, B, C, D và E. Sau đó, bạn tìm hiểu các tham số của mô hình của bạn (của chính mô hình) trong 4 bộ, giả sử A, B, C và D, và kiểm tra nó hoặc xác nhận nó trong mô hình thứ năm E. (Điều này bạn đã làm). Nhưng sau đó, bạn chọn một bộ khác làm thử nghiệm / xác nhận (giả sử D) và tìm hiểu bằng cách sử dụng 4 bộ khác (A, B, C và E). Kiểm tra nó trên D, lặp lại.
Lỗi bạn mô hình dự đoán của bạn là lỗi trung bình của 5 bài kiểm tra - và bạn có một số hiểu biết về cách lỗi dự đoán phụ thuộc vào các bộ kiểm tra và học tập. Trong trường hợp tốt nhất, tất cả 5 biện pháp lỗi đều tương tự nhau và bạn có thể chắc chắn rằng mô hình của bạn sẽ hoạt động ở mức đó trong tương lai.
Nhưng mô hình gì ?? Đối với mỗi bộ học tập, bạn sẽ có một tham số khác nhau cho mô hình. Học với A, B, C, D tạo ra một bộ tham số P1, học với A, B, C, E, bộ tham số P2, tối đa P5. Không ai trong số họ là mô hình của bạn.
Những gì bạn đã kiểm tra là lỗi dự kiến của một quy trình xây dựng mô hình , quy trình mà bạn đã tuân theo khi tập học là A, B, C, D và khi đó là A, B, C, E, v.v. Là thủ tục này tạo ra một mô hình với lỗi dự kiến.
Vậy mô hình cuối cùng là gì? Đây là ứng dụng của quy trình trong tất cả các dữ liệu bạn có sẵn (A, B, C, D và E). Một mô hình mới với bộ tham số P0 mà bạn chưa từng tạo trước đây, bạn không có dữ liệu để kiểm tra nó (vì bạn đã "sử dụng" tất cả dữ liệu để xác định tham số P0) và bạn có một kỳ vọng hợp lý rằng nó sẽ thực hiện trong tương lai dữ liệu như các mô hình khác (P1, P2 ...) được xây dựng bằng quy trình tương tự đã làm.
Điều gì xảy ra nếu bạn không thực hiện xác thực chéo hoặc bootstrap (bootstrap có phần phức tạp hơn để giải thích - tôi bỏ qua cuộc thảo luận này)? Điều gì sẽ xảy ra nếu bạn chỉ thực hiện một phân tách học tập / xác nhận và một thước đo lỗi. Sau đó, đối số 2. có thể đúng một chút nhưng bạn có một vấn đề lớn hơn - bạn chỉ có một thước đo lỗi của mô hình và bạn không biết mức độ phụ thuộc của lỗi đó vào dữ liệu được sử dụng để xác thực nó. Có thể, do may mắn, bộ xác nhận 20% của bạn đặc biệt dễ dự đoán. Không thực hiện nhiều biện pháp lỗi, sẽ rất rủi ro khi cho rằng tỷ lệ lỗi dự kiến của mô hình dự đoán của bạn sẽ giữ nguyên cho dữ liệu trong tương lai.
Đó là "rủi ro lớn hơn"? Giả sử rằng lỗi đó về cơ bản vẫn giống với dữ liệu trong tương lai hoặc giả sử rằng việc thêm nhiều dữ liệu để tìm hiểu mô hình của bạn theo một cách nào đó sẽ "làm hỏng" mô hình và tăng tỷ lệ lỗi trong tương lai? Tôi thực sự không biết làm thế nào để trả lời điều này, nhưng tôi sẽ nghi ngờ về các mô hình trở nên tồi tệ hơn với nhiều dữ liệu hơn ....