Tôi có một số dữ liệu và tôi muốn xây dựng một mô hình (giả sử mô hình hồi quy tuyến tính) từ dữ liệu này. Trong bước tiếp theo, tôi muốn áp dụng Xác thực chéo một lần (LOOCV) trên mô hình để xem nó hoạt động tốt như thế nào.
Nếu tôi hiểu đúng LOOCV, tôi sẽ xây dựng một mô hình mới cho từng mẫu của mình (bộ thử nghiệm) bằng cách sử dụng mọi mẫu ngoại trừ mẫu này (bộ huấn luyện). Sau đó, tôi sử dụng mô hình để dự đoán tập kiểm tra và tính toán các lỗi .
Trong bước tiếp theo, tôi tổng hợp tất cả các lỗi được tạo bằng hàm đã chọn, ví dụ như lỗi bình phương. Tôi có thể sử dụng các giá trị này để đánh giá chất lượng (hoặc mức độ phù hợp) của mô hình.
Câu hỏi: Mô hình nào là mô hình mà các giá trị chất lượng này áp dụng cho, vậy tôi nên chọn mô hình nào nếu tôi thấy các số liệu được tạo từ LOOCV phù hợp với trường hợp của tôi? LOOCV đã xem xét mô hình khác nhau (trong đó là cỡ mẫu); Tôi nên chọn mô hình nào?
- Đây có phải là mô hình sử dụng tất cả các mẫu? Mô hình này không bao giờ được tính toán trong quá trình LOOCV!
- Đây có phải là mô hình có ít lỗi nhất?