Cách tốt nhất / chính xác để kết hợp phân tích văn bản với các tính năng khác là gì? Ví dụ: tôi có một bộ dữ liệu với một số văn bản nhưng cũng có các tính năng / danh mục khác. Công cụ vector TF-IDF của SKlearn biến đổi dữ liệu văn bản thành ma trận thưa thớt. Tôi có thể sử dụng các ma trận thưa thớt này trực tiếp với trình phân loại Naive Bayes chẳng hạn. Nhưng cách nào để tính đến các tính năng khác? Tôi có nên bỏ qua phần trình bày tf-idf của văn bản và kết hợp các tính năng và văn bản thành một DataFrame không? Hoặc tôi có thể giữ ma trận thưa thớt như một cột riêng chẳng hạn? Cách chính xác để làm điều này là gì?