Đây là một câu hỏi nói chung, không cụ thể cho bất kỳ phương pháp hoặc tập dữ liệu. Làm thế nào để chúng ta giải quyết vấn đề mất cân bằng lớp học trong Supervised Machine learning trong đó số 0 là khoảng 90% và số 1 là khoảng 10% trong tập dữ liệu của bạn. Làm thế nào để chúng ta đào tạo tối ưu trình phân loại.
Một trong những cách tôi làm theo là lấy mẫu để làm cho tập dữ liệu cân bằng và sau đó huấn luyện bộ phân loại và lặp lại điều này cho nhiều mẫu.
Tôi cảm thấy điều này là ngẫu nhiên, Có khuôn khổ nào để tiếp cận những vấn đề này không.