Bên cạnh các đặc điểm phân loại rõ ràng như
- chi phí tính toán,
- loại dữ liệu dự kiến của các tính năng / nhãn và
- sự phù hợp cho kích thước và kích thước nhất định của tập dữ liệu,
Năm phân loại (hoặc 10, 20?) hàng đầu để thử đầu tiên trên tập dữ liệu mới mà người ta chưa biết nhiều về (ví dụ như ngữ nghĩa và tương quan của các tính năng riêng lẻ) là gì? Thông thường tôi thử Naive Bayes, Hàng xóm gần nhất, Cây quyết định và SVM - mặc dù tôi không có lý do chính đáng nào cho lựa chọn này ngoài việc tôi biết chúng và chủ yếu hiểu cách chúng hoạt động.
Tôi đoán người ta nên chọn các phân loại bao gồm các cách tiếp cận phân loại chung quan trọng nhất . Lựa chọn nào bạn muốn giới thiệu, theo tiêu chí đó hoặc vì lý do nào khác?
CẬP NHẬT: Một công thức thay thế cho câu hỏi này có thể là: "Phương pháp chung nào để phân loại tồn tại và phương pháp cụ thể nào bao gồm những phương pháp quan trọng nhất / phổ biến / có triển vọng?"