Trong python sklearn, có nhiều thuật toán (ví dụ hồi quy, rừng ngẫu nhiên ... vv) có tham số class_ weight để xử lý dữ liệu không cân bằng.
Tuy nhiên, tôi không tìm thấy tham số như vậy cho các thuật toán MLLib. Có kế hoạch triển khai class_ weight cho một số thuật toán MLLib không? Hoặc có bất kỳ cách tiếp cận nào trong MLLib cho dữ liệu không cân bằng? Hoặc chúng ta thực sự phải tự xử lý tất cả các up / downsampling trong MLLib?
Cảm ơn!