Hãy để chúng tôi nói rằng tôi có một loạt các hàng cho một vấn đề phân loại:
Trong đó là các tính năng / dự đoán và Y là lớp kết hợp tính năng của hàng.
Nhiều kết hợp tính năng và các lớp của chúng được lặp lại trong tập dữ liệu mà tôi đang sử dụng để phù hợp với trình phân loại. Tôi chỉ tự hỏi liệu có thể chấp nhận loại bỏ trùng lặp (về cơ bản tôi thực hiện một group by X1 ... XN Y
trong SQL)? Cảm ơn.
Tái bút
Đây là dữ liệu chỉ dành cho sự hiện diện nhị phân trong đó các linh mục lớp khá sai lệch