Trong bài học sâu của François Chollet với Python, nó nói:
Do đó, việc điều chỉnh cấu hình của mô hình dựa trên hiệu suất của nó trên bộ xác thực có thể nhanh chóng dẫn đến việc quá mức cho bộ xác thực, mặc dù mô hình của bạn không bao giờ được đào tạo trực tiếp về nó.
Trung tâm của hiện tượng này là khái niệm rò rỉ thông tin. Mỗi khi bạn điều chỉnh siêu tham số của mô hình dựa trên hiệu suất của mô hình trên bộ xác thực, một số thông tin về rò rỉ dữ liệu xác thực vào mô hình . Nếu bạn chỉ làm điều này một lần, cho một tham số, thì rất ít bit thông tin sẽ bị rò rỉ và bộ xác thực của bạn sẽ vẫn đáng tin cậy để đánh giá mô hình. Nhưng nếu bạn lặp lại điều này nhiều lần, khi chạy một thử nghiệm, đánh giá trên bộ xác thực và sửa đổi mô hình của bạn như một kết quả, thì bạn sẽ rò rỉ một lượng thông tin ngày càng đáng kể về xác thực được đặt vào mô hình.
Tại sao thông tin về dữ liệu xác nhận bị rò rỉ nếu tôi đánh giá hiệu suất mô hình trên dữ liệu xác thực khi điều chỉnh siêu âm?