Thật khó để nói mà không biết thêm một chút về tập dữ liệu của bạn và cách tập dữ liệu của bạn dựa trên vectơ đặc trưng của bạn, nhưng tôi có thể khuyên bạn nên sử dụng rừng ngẫu nhiên cực kỳ trên các khu rừng ngẫu nhiên tiêu chuẩn vì tập mẫu tương đối nhỏ của bạn.
Các khu rừng ngẫu nhiên cực kỳ giống với các khu rừng ngẫu nhiên tiêu chuẩn với một ngoại lệ là thay vì tối ưu hóa sự phân chia trên cây, khu rừng ngẫu nhiên cực kỳ tạo ra sự phân chia ngẫu nhiên. Ban đầu điều này có vẻ như là một tiêu cực, nhưng nó thường có nghĩa là bạn có khả năng khái quát hóa và tốc độ tốt hơn đáng kể, mặc dù AUC trên tập huấn luyện của bạn có thể sẽ tệ hơn một chút.
Hồi quy logistic cũng là một đặt cược khá vững chắc cho các loại nhiệm vụ này, mặc dù với kích thước tương đối thấp và kích thước mẫu nhỏ của bạn, tôi sẽ lo lắng về việc quá mức. Bạn có thể muốn kiểm tra bằng cách sử dụng Hàng xóm gần nhất vì nó thường thực hiện rất tốt với các chiều thấp, nhưng nó thường không xử lý các biến phân loại rất tốt.
Nếu tôi phải chọn một mà không biết thêm về vấn đề, tôi chắc chắn sẽ đặt cược vào khu rừng ngẫu nhiên cực kỳ, vì rất có khả năng giúp bạn khái quát tốt về loại dữ liệu này và nó cũng xử lý kết hợp dữ liệu số và phân loại tốt hơn hơn hầu hết các phương pháp khác.