Câu hỏi này có thể ở đây hoặc trên SO có lẽ ...
Giả sử rằng tập dữ liệu đào tạo của bạn chứa cả dữ liệu phân loại và liên tục, chẳng hạn như thiết lập này:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
Và biến phụ thuộc được dự đoán là chi phí bác sĩ thú y hàng năm. Tôi hơi bối rối về các kỹ thuật cụ thể có sẵn để đối phó với một bộ dữ liệu như vậy. Các phương pháp thường được sử dụng để đối phó với các bộ dữ liệu là hỗn hợp của cả dữ liệu liên tục và phân loại là gì?