Gần đây tôi đã biết rằng một trong những cách để tìm giải pháp tốt hơn cho các vấn đề ML là tạo ra các tính năng. Người ta có thể làm điều đó bằng cách ví dụ tóm tắt hai tính năng.
Ví dụ: chúng tôi có hai tính năng "tấn công" và "phòng thủ" của một loại anh hùng nào đó. Sau đó, chúng tôi tạo ra tính năng bổ sung gọi là "tổng" là tổng của "tấn công" và "phòng thủ". Bây giờ điều kỳ lạ đối với tôi là "tấn công" và "phòng thủ" khó khăn gần như hoàn toàn tương quan với "tổng số" chúng ta vẫn có được thông tin hữu ích.
Toán học đằng sau đó là gì? Hay là tôi suy luận sai?
Ngoài ra, đó không phải là vấn đề, đối với các nhà phân loại như kNN, rằng "tổng" sẽ luôn lớn hơn "tấn công" hay "phòng thủ"? Vì vậy, ngay cả sau khi chuẩn hóa chúng ta sẽ có các tính năng chứa các giá trị từ các phạm vi khác nhau?