Giả sử tôi có cỡ mẫu nhỏ, ví dụ N = 100 và hai lớp. Tôi nên chọn kích cỡ tập huấn, xác thực chéo và tập kiểm tra cho máy học như thế nào?
Tôi sẽ chọn trực giác
- Tập kích thước tập là 50
- Xác thực chéo đặt kích thước 25 và
- Kích thước thử nghiệm là 25.
Nhưng có lẽ điều này làm cho ít nhiều ý nghĩa. Làm thế nào tôi thực sự nên quyết định những giá trị này? Tôi có thể thử các tùy chọn khác nhau không (mặc dù tôi đoán nó không thích hợp hơn ... tăng khả năng học tập quá mức)?
Nếu tôi có nhiều hơn hai lớp thì sao?