Đối với sự phù hợp quá mức trong lựa chọn mô hình, thì một bài báo đáng đọc là
C. Ambroise và GJ McLachlan, "Lựa chọn sai lệch trong trích xuất gen trên cơ sở dữ liệu biểu hiện gen microarray", PNAS, vol. 99 không. 10 6562-6566, tháng 5 năm 2002. http://dx.doi.org/10.1073/pnas.102102699
Để thảo luận về cùng loại vấn đề phát sinh trong lựa chọn mô hình, xem
GC Cawley, NLC Talbot, "Về sự phù hợp quá mức trong lựa chọn mô hình và xu hướng lựa chọn tiếp theo trong đánh giá hiệu suất", Tạp chí nghiên cứu máy học, 11 (tháng 7): 2079−2107, 2010 http://jmlr.csail.mit. edu / giấy tờ / v11 / cawley10a.html
Cách để giải quyết vấn đề của bộ xác thực trở nên vô hiệu là sử dụng xác thực chéo lồng nhau, vì vậy phương pháp được sử dụng để đưa ra các lựa chọn về mô hình được thực hiện độc lập trong mỗi lần xác thực chéo được sử dụng để ước tính hiệu suất. Về cơ bản, ước tính hiệu suất phải ước tính hiệu suất của toàn bộ quy trình khớp mô hình (phù hợp với mô hình, lựa chọn tính năng, lựa chọn mô hình, mọi thứ).
Cách tiếp cận khác là trở thành một người Bayes. Nguy cơ của sự phù hợp quá mức được đưa ra bất cứ khi nào bạn tối ưu hóa một tiêu chí dựa trên một mẫu dữ liệu hữu hạn, vì vậy nếu bạn làm cho lề (tích hợp ra) thay vì tối ưu hóa thì việc khớp quá mức cổ điển là không thể. Tuy nhiên, bạn có vấn đề về việc chỉ định các linh mục.