Tôi có dữ liệu thô có khoảng 20 cột (20 tính năng). Mười trong số đó là dữ liệu liên tục và 10 trong số đó là phân loại. Một số dữ liệu phân loại có thể có 50 giá trị khác nhau (Hoa Kỳ). Sau khi tôi xử lý trước dữ liệu, 10 cột liên tục trở thành 10 cột được chuẩn bị và 10 giá trị phân loại trở thành giống như 200 biến được mã hóa một lần nóng. Tôi lo ngại rằng nếu tôi đặt tất cả các tính năng 200 + 10 = 210 này vào mạng lưới thần kinh thì các tính năng 200 một nóng (10 cột phân loại) sẽ hoàn toàn thống trị các tính năng 10 liên tục.
Có lẽ một phương pháp sẽ là "nhóm" các cột lại với nhau hoặc một cái gì đó. Đây có phải là một mối quan tâm hợp lệ và có cách nào để xử lý vấn đề này không?
(Tôi đang sử dụng Keras, mặc dù tôi không nghĩ nó quan trọng lắm.)