Nếu bạn thực hiện không chỉ bao gồm bỏ qua một lần mà bất kỳ loại thay thế nào mà không cần thay thế, chẳng hạn như thủ tục Fold, tôi coi đó là một lựa chọn khả thi và sử dụng thường xuyên, ví dụ như trong
Beleites et al.k: Phân loại phổ Raman của các mô tế bào hình sao: sử dụng thông tin tham khảo mềm. Bioanal chem, 2011, 400, 2801-2816
xem thêm: Khoảng tin cậy cho độ chính xác phân loại được xác thực chéo
Tôi tránh LOO vì một số lý do và thay vào đó sử dụng sơ đồ lặp đi lặp lại / lặp đi lặp lại . Trong lĩnh vực của tôi (hóa học / quang phổ / hóa học), xác nhận chéo là phổ biến hơn nhiều so với xác nhận ngoài bootstrap. Đối với dữ liệu / ứng dụng typcial chúng tôi thấy rằng tôi lần lặp k -fold kiểm chứng chéo và i ⋅ k lặp của out-of-bootstrap ước tính hiệu suất có tổng lỗi rất giống nhau [Beleites et al. : Giảm phương sai trong ước tính lỗi phân loại bằng cách sử dụng bộ dữ liệu thưa thớt. Chem.Intell.Lab.Syst., 2005, 79, 91 - 100.] .kTôiktôi ⋅ k
xxx trường hợp?" Đây là loại áp dụng cho bootstrapping là tốt, nhưng ít trực tiếp hơn.
nSnp« nS
np
Tôiki
Thông thường, tức là nếu mô hình được thiết lập tốt, 2. chỉ cần thiết để cho thấy rằng nó nhỏ hơn nhiều so với phương sai trong 1. và do đó mô hình ổn định hợp lý. Nếu 2. hóa ra là không đáng kể, đã đến lúc xem xét các mô hình tổng hợp: tập hợp mô hình chỉ giúp cho phương sai gây ra bởi sự không ổn định của mô hình, nó không thể làm giảm độ không đảm bảo của phương sai trong phép đo hiệu suất do số lượng các trường hợp thử nghiệm hữu hạn .
ikk⋅kk
Các lợi thế của kiểm chứng chéo ở đây là bạn có được một sự tách biệt rõ ràng giữa sự không chắc chắn gây ra bởi mô hình bất ổn và bất ổn gây ra bởi số hữu hạn các trường hợp thử nghiệm. Tất nhiên, nhược điểm tương ứng là nếu bạn quên tính đến số lượng hữu hạn của các trường hợp thực tế, bạn sẽ đánh giá thấp sự không chắc chắn thực sự. Tuy nhiên, điều này cũng sẽ xảy ra đối với bootstrapping (mặc dù ở mức độ thấp hơn).
Cho đến nay, lý do cô đặc về đo lường hiệu suất cho các mô hình mà bạn lấy được một cho tập dữ liệu. Nếu bạn xem xét một tập dữ liệu cho ứng dụng đã cho và với cỡ mẫu đã cho, có một đóng góp thứ ba cho phương sai mà về cơ bản không thể đo lường được bằng cách lấy lại xác thực, xem ví dụ: Bengio & Grandvalet: Không ước lượng không thiên vị của phương sai của K-Fold Cross -Đánh giá, Tạp chí Nghiên cứu Máy học, 5, 1089-1105 (2004). , chúng tôi cũng có số liệu cho thấy ba đóng góp này trong Beleites et al. : Lập kế hoạch cỡ mẫu cho các mô hình phân loại., Anal Chim Acta, 760, 25-33 (2013). DOI: 10.1016 / j.aca.2012.11.007 )
Tôi nghĩ những gì xảy ra ở đây là kết quả của giả định rằng việc lấy lại mẫu tương tự như vẽ một mẫu hoàn toàn mới bị phá vỡ.
Điều này rất quan trọng nếu so sánh các thuật toán / chiến lược / heuristic xây dựng mô hình thay vì xây dựng một mô hình cụ thể cho ứng dụng và xác nhận mô hình này.