Làm thế nào để chúng ta sử dụng một mã hóa nóng nếu số lượng giá trị mà một biến phân loại có thể lấy là lớn?
Trong trường hợp của tôi, nó là 56 giá trị. Vì vậy, theo phương pháp thông thường, tôi sẽ phải thêm 56 cột (56 tính năng nhị phân) trong tập dữ liệu huấn luyện, điều này sẽ làm tăng sự phức tạp và do đó thời gian đào tạo.
Vậy làm thế nào để chúng ta đối phó với các trường hợp như vậy?