Không có câu trả lời duy nhất nào là phương pháp phân loại tốt nhất cho một tập dữ liệu nhất định . Các loại phân loại khác nhau phải luôn luôn được xem xét cho một nghiên cứu so sánh trên một tập dữ liệu nhất định. Với các thuộc tính của tập dữ liệu, bạn có thể có một số manh mối có thể ưu tiên cho một số phương pháp. Tuy nhiên, vẫn nên thử nghiệm với tất cả, nếu có thể.
Naive Bayes Classifier (NBC) và Support Vector Machine (SVM) có các tùy chọn khác nhau bao gồm cả việc lựa chọn chức năng kernel cho mỗi loại. Cả hai đều nhạy cảm với tối ưu hóa tham số (nghĩa là lựa chọn tham số khác nhau có thể thay đổi đáng kể đầu ra của chúng) . Vì vậy, nếu bạn có kết quả cho thấy NBC hoạt động tốt hơn SVM. Điều này chỉ đúng với các tham số đã chọn. Tuy nhiên, đối với lựa chọn tham số khác, bạn có thể thấy SVM đang hoạt động tốt hơn.
Nói chung, nếu giả định về tính độc lập trong NBC được thỏa mãn bởi các biến của tập dữ liệu của bạn và mức độ chồng chéo của lớp là nhỏ (tức là ranh giới quyết định tuyến tính tiềm năng), NBC sẽ đạt được kết quả tốt. Ví dụ, đối với một số bộ dữ liệu, với việc tối ưu hóa bằng cách sử dụng lựa chọn tính năng trình bao bọc, NBC có thể đánh bại các phân loại khác. Ngay cả khi nó đạt được hiệu suất tương đương, NBC sẽ được mong muốn hơn vì tốc độ cao.
Tóm lại, chúng ta không nên thích bất kỳ phương pháp phân loại nào nếu nó vượt trội hơn các phương pháp khác trong một bối cảnh vì nó có thể thất bại nặng nề trong một phương thức khác. ( ĐÂY LÀ BÌNH THƯỜNG TRONG VẤN ĐỀ KHAI THÁC DỮ LIỆU ).