Tôi có một bộ huấn luyện với khoảng 3000 trường hợp tích cực và 3000 trường hợp tiêu cực. Nhưng bộ dữ liệu thử nghiệm của tôi là khá nhiều không cân bằng. Tập hợp dương chỉ có 50 trường hợp và âm có 1500 trường hợp. Điều này gây ra độ chính xác rất thấp. Có cách tiếp cận nào để giải quyết vấn đề này không? Tôi sử dụng SVM để xây dựng phân loại.