Xin chào có khung dữ liệu với các giá trị phân loại lớn trên 1600 danh mục, có bất kỳ cách nào tôi có thể tìm thấy các lựa chọn thay thế để tôi không có hơn 1600 cột.
Tôi tìm thấy liên kết thú vị dưới đây http://amunargetui.github.io/feature-hashing/#sourcecode
Nhưng họ đang chuyển đổi sang lớp / đối tượng mà tôi không muốn. Tôi muốn đầu ra cuối cùng của mình dưới dạng một khung dữ liệu để tôi có thể thử nghiệm với các mô hình học máy khác nhau? hoặc có cách nào để tôi có thể sử dụng ma trận genetrated để huấn luyện các mô hình học máy khác ngoài hồi quy Logistic hay XGBoost không?
Có cách nào tôi có thể thực hiện?