Dữ liệu không cân bằng là một vấn đề phổ biến trong tất cả các lĩnh vực và không liên quan cụ thể đến tầm nhìn máy tính và các vấn đề được giải quyết bởi Mạng lưới thần kinh chuyển đổi (CNNs).
Để giải quyết vấn đề này, bạn nên cố gắng cân bằng tập dữ liệu của mình, bằng cách lấy mẫu quá mức các lớp thiểu số hoặc các lớp đa số dưới mẫu (hoặc cả hai). Có thể cho rằng, một lựa chọn tốt sẽ là thuật toán SMote (Kỹ thuật lấy mẫu quá mức tổng hợp), như đã đề cập ở trên. Ở đây bạn có thể tìm thấy một so sánh các thuật toán lấy mẫu quá mức khác nhau. Nếu bạn là người dùng Python, mất cân bằng tìm hiểu là một thư viện đẹp, thực hiện nhiều kỹ thuật hữu ích để cân bằng các bộ dữ liệu.
Mặt khác, nếu bạn đang cố gắng phân loại hình ảnh, một cách hay để tăng kích thước tập dữ liệu của bạn là tăng nó (tức là bằng cách tạo các ví dụ tổng hợp hợp lý, ví dụ như hình ảnh tương tự nhưng được xoay / dịch chuyển một chút so với hình gốc). Đôi khi bạn có thể thấy hữu ích khi tăng các lớp thiểu số để đạt được sự cân bằng tốt hơn. Lớp Keras ImageDataGenerator là một công cụ tốt cho mục đích này.