Tập dữ liệu trông như:
- 25000 quan sát
- lên đến 15 dự đoán thuộc các loại khác nhau: số, phân loại nhiều lớp, nhị phân
- biến mục tiêu là nhị phân
Phương pháp xác nhận chéo nào là điển hình cho loại vấn đề này?
Theo mặc định, tôi đang sử dụng K-Fold. Bao nhiêu lần là đủ trong trường hợp này? (Một trong những mô hình tôi sử dụng là rừng ngẫu nhiên, tốn thời gian ...)