EDIT: Điều chỉnh hoặc chọn một mô hình dựa trên xác thực chéo về cơ bản là cố gắng giảm thiểu lỗi dự đoán (ví dụ: lỗi dự đoán bình phương trung bình). Bạn chọn một mô hình có điều kiện trên một số tập hợp con của dữ liệu đầu vào và dự đoán đầu ra ở các vị trí bên trái. Theo trực giác, đó là một dự đoán bởi vì bạn đang đánh giá mô hình ở ngoài các vị trí mẫu. Câu hỏi của bạn là điều gì xảy ra nếu bộ mô hình ứng cử viên của bạn độc lập với dữ liệu đầu vào (nghĩa là bạn không sử dụng bất kỳ dữ liệu nào khi tạo mô hình ngẫu nhiên).
Giả định này không khác biệt so với bất kỳ quy trình lắp mô hình nào khác. Ví dụ: nếu tôi bắt đầu với một mô hình được tham số hóa và các tham số có thể là bất kỳ số thực nào, thì tôi cũng có một bộ mô hình ứng cử viên vô hạn. Cả hai chúng ta vẫn cần chọn mô hình tốt nhất từ tập hợp các mô hình có thể bằng cách giảm thiểu một số số liệu lỗi. Do đó, cả hai lựa chọn mô hình của chúng tôi đều có điều kiện trên một số dữ liệu đào tạo (có thể là tập hợp con của tất cả dữ liệu đào tạo nếu sử dụng xác thực chéo). Bạn không chỉ định số liệu lỗi vì vậy hãy giả sử đó là lỗi bình phương trung bình (MSE). Tôi chọn tham số mô hình và do đó mô hình của tôi sử dụng một số quy trình hộp đen giả sử số liệu MSE có điều kiện trên dữ liệu đào tạo. Bạn chọn mô hình của mình từ nhóm mô hình ngẫu nhiên giả sử có số liệu MSE có điều kiện về dữ liệu đào tạo.
Chúng ta có chọn cùng một mô hình không? Nó phụ thuộc vào việc bạn bắt đầu với các bộ mô hình ứng cử viên khác nhau.
Chúng ta có quá phù hợp với dữ liệu không? Nó phụ thuộc vào tập hợp các mô hình ứng cử viên mà chúng tôi đã bắt đầu và dữ liệu đào tạo.
Chúng ta có biết chúng ta quá phù hợp với dữ liệu? Nếu chúng tôi xác nhận chéo thì chúng tôi có thể kiểm tra lỗi dự đoán.
TRẢ LỜI GỐC: Theo nghĩa rộng, có một số tín hiệu trong dữ liệu và một số nhiễu. Khi chúng ta tập luyện quá sức, chúng ta cơ bản phù hợp với tiếng ồn.
Trong xác thực chéo, chúng tôi bỏ qua các phần dữ liệu khi khớp và đánh giá lỗi khi dự đoán các điểm bị bỏ sót. Nó tương tự như việc có dữ liệu huấn luyện và kiểm tra ở chỗ chúng tôi đang đo lỗi do lỗi mẫu. Mô hình phải khái quát tốt bất kể điểm nào bị bỏ qua. Nếu chúng ta phù hợp với tiếng ồn, mô hình sẽ không khái quát tốt. Tập hợp các mô hình mà chúng tôi đang so sánh có thể không bao gồm các mô hình cố gắng nội suy một điểm dữ liệu khi nó bị bỏ qua khỏi dữ liệu huấn luyện. Nếu mô hình hoạt động theo cách này (ví dụ: hành vi ngẫu nhiên để cải thiện sự phù hợp) thì có khả năng chúng tôi không có quy trình điều chỉnh mô hình chung hợp lý và xác thực chéo không thể giúp chúng tôi.
Nếu bạn có một bộ mô hình vô hạn và một lượng thời gian vô hạn thì tôi đoán theo lý thuyết bạn có thể tạo ra một mô hình tốt hoặc tốt hơn bất kỳ mô hình nào được tạo thông qua bất kỳ quy trình nào khác. Làm thế nào bạn sẽ biết mô hình từ bộ vô hạn của bạn mặc dù? Nếu đó là mô hình nội suy dữ liệu đào tạo, thì có, nó sẽ phù hợp khi dữ liệu đào tạo bị nhiễu.