Tôi bực mình nhất (và thường xuyên nhất) bực mình vì "xác thực" nhằm mục đích lỗi tổng quát hóa của các mô hình dự đoán trong đó dữ liệu thử nghiệm không độc lập (ví dụ: nhiều phép đo cho mỗi bệnh nhân trong dữ liệu, các phép đo tách ra khỏi bootstrap hoặc chéo xác thực không bệnh nhân ).
Thậm chí còn khó chịu hơn, các bài báo đưa ra kết quả xác thực chéo không hoàn hảo như vậy cộng với một bộ kiểm tra độc lập chứng minh sự thiên vị quá mức của xác thực chéo nhưng không phải là một từ mà thiết kế xác thực chéo là sai ...
(Tôi sẽ rất vui nếu dữ liệu tương tự sẽ được trình bày "chúng tôi biết việc xác thực chéo sẽ phân chia bệnh nhân, nhưng chúng tôi bị mắc kẹt với phần mềm không cho phép điều này. Do đó, chúng tôi đã thử nghiệm thêm một nhóm bệnh nhân thử nghiệm độc lập thực sự. ")
(Tôi cũng biết rằng bootstrapping = resampling với thay thế thường hoạt động tốt hơn so với xác thực chéo = lấy mẫu lại mà không thay thế. Tuy nhiên, chúng tôi đã tìm thấy dữ liệu phổ (mô phỏng phổ và thiết lập mô hình hơi nhân tạo nhưng quang phổ thực) lặp đi lặp lại / xác thực chéo -of-bootstrap có độ không đảm bảo chung tương tự nhau, oob có nhiều sai lệch nhưng ít sai lệch hơn - để viết lại, tôi đang xem xét điều này từ góc độ rất thực tế: xác nhận chéo lặp lại so với ngoài bootstrap không quan trọng miễn là nhiều giấy tờ không phân chia bệnh nhân khôn ngoan cũng không báo cáo / thảo luận / đề cập đến sự không chắc chắn ngẫu nhiên do kích thước mẫu thử nghiệm hạn chế.)
Bên cạnh việc sai, điều này cũng có tác dụng phụ là những người thực hiện xác nhận hợp lệ thường phải bảo vệ tại sao kết quả của họ lại tệ hơn nhiều so với tất cả những kết quả khác trong tài liệu.