Tôi biết rằng việc thực hiện điều chỉnh siêu tham số bên ngoài xác thực chéo có thể dẫn đến các ước tính cao về tính hợp lệ bên ngoài, bởi vì tập dữ liệu mà bạn sử dụng để đo hiệu suất là giống như bạn đã sử dụng để điều chỉnh các tính năng.
Điều tôi băn khoăn là vấn đề này tệ đến mức nào . Tôi có thể hiểu làm thế nào nó sẽ thực sự tồi tệ cho việc lựa chọn tính năng, vì điều này cung cấp cho bạn một số lượng lớn các tham số để điều chỉnh. Nhưng điều gì sẽ xảy ra nếu bạn đang sử dụng một cái gì đó như LASSO (chỉ có một tham số, cường độ chính quy) hoặc một khu rừng ngẫu nhiên không có lựa chọn tính năng (có thể có một vài tham số nhưng không có gì ấn tượng bằng việc thêm / giảm các tính năng nhiễu)?
Trong các kịch bản này, bạn có thể mong đợi mức độ lạc quan của mình đến mức nào?
Tôi đánh giá cao bất kỳ thông tin nào về việc này - nghiên cứu trường hợp, bài báo, giai thoại, v.v ... Cảm ơn!
EDIT: Để làm rõ, tôi không nói về việc ước tính hiệu suất mô hình trên dữ liệu đào tạo (nghĩa là hoàn toàn không sử dụng xác nhận chéo). Bằng cách "điều chỉnh siêu tham số bên ngoài xác thực chéo" Tôi có nghĩa là chỉ sử dụng xác thực chéo để ước tính hiệu suất của từng mô hình riêng lẻ, nhưng không bao gồm vòng lặp xác thực chéo thứ hai bên ngoài để sửa lỗi cho quá mức trong quy trình điều chỉnh siêu tham số (như khác biệt với quá mức trong quá trình đào tạo). Xem ví dụ câu trả lời ở đây .