Tôi đã sử dụng các -fold cross-validation một vài lần bây giờ để đánh giá hiệu suất của một số thuật toán học, nhưng tôi đã luôn luôn được bối rối như thế nào tôi nên chọn giá trị của .K
Tôi thường thấy và sử dụng giá trị , nhưng điều này dường như hoàn toàn tùy ý với tôi và bây giờ tôi chỉ sử dụng theo thói quen thay vì nghĩ về nó. Đối với tôi có vẻ như bạn đang có được độ chi tiết tốt hơn khi bạn cải thiện giá trị của , vì vậy lý tưởng nhất là bạn nên làm cho của bạn rất lớn, nhưng cũng có nguy cơ bị sai lệch.10 K K
Tôi muốn biết giá trị của nên phụ thuộc vào điều gì và tôi nên nghĩ về điều này như thế nào khi đánh giá thuật toán của mình. Nó có thay đổi điều gì nếu tôi sử dụng phiên bản phân tầng của xác thực chéo hay không?