Tôi biết rằng để truy cập vào hiệu suất của trình phân loại, tôi phải chia dữ liệu thành tập huấn luyện / kiểm tra. Nhưng đọc nó :
Khi đánh giá các cài đặt khác nhau (siêu tốc độ của máy tính) cho các công cụ ước tính, chẳng hạn như cài đặt C phải được đặt thủ công cho một SVM, vẫn có nguy cơ bị quá mức trên bộ kiểm tra vì các tham số có thể được điều chỉnh cho đến khi công cụ ước tính thực hiện tối ưu. Bằng cách này, kiến thức về bộ kiểm tra có thể bị rò rỉ vào mô hình và các số liệu đánh giá không còn báo cáo về hiệu suất tổng quát. Để giải quyết vấn đề này, một phần khác của bộ dữ liệu có thể được tổ chức như một bộ được gọi là bộ xác nhận mã hóa của bộ điều khiển tên lửa: tập huấn tiến hành trên tập huấn luyện, sau đó đánh giá được thực hiện trên bộ xác thực và khi thử nghiệm có vẻ thành công , đánh giá cuối cùng có thể được thực hiện trên bộ thử nghiệm.
Tôi thấy rằng một bộ xác nhận (thứ ba) khác được giới thiệu, được chứng minh bằng cách quá mức của bộ kiểm tra trong quá trình điều chỉnh siêu đường kính.
Vấn đề là tôi không thể hiểu làm thế nào quá mức này có thể xuất hiện và do đó không thể hiểu được sự biện minh của bộ thứ ba.