Ý kiến của bạn về oversampling trong phân loại nói chung và thuật toán SMOTE nói riêng là gì? Tại sao chúng ta không chỉ áp dụng một chi phí / hình phạt để điều chỉnh sự mất cân bằng trong dữ liệu lớp và bất kỳ chi phí lỗi không cân bằng nào? Đối với mục đích của tôi, độ chính xác của dự đoán đối với các đơn vị thử nghiệm trong tương lai là biện pháp cuối cùng.
Để tham khảo, giấy SMOTE: http://www.jair.org/ con / paper953.html