Kỹ thuật tính năng thường là một thành phần quan trọng đối với học máy (nó được sử dụng rất nhiều để giành Cup KDD năm 2010 ). Tuy nhiên, tôi thấy rằng hầu hết các tính năng kỹ thuật kỹ thuật hoặc
- phá hủy bất kỳ ý nghĩa trực quan của các tính năng cơ bản hoặc
- là rất cụ thể cho một tên miền cụ thể hoặc thậm chí các loại tính năng cụ thể.
Một ví dụ kinh điển trước đây sẽ là phân tích thành phần chính. Dường như với tôi rằng bất kỳ kiến thức nào mà một chuyên gia về chủ đề sẽ có về các tính năng sẽ bị phá hủy bằng cách chuyển đổi các tính năng đó thành các thành phần chính.
Ngược lại với một kỹ thuật đơn giản là chuyển đổi một ngày thành các tính năng cho "ngày trong tháng" và "ngày trong tuần". Ý nghĩa cơ bản vẫn được giữ lại trong các tính năng mới, nhưng rõ ràng kỹ thuật đặc biệt này chỉ áp dụng cho các ngày và không phải là các tính năng tùy ý.
Có bất kỳ cơ quan tiêu chuẩn nào của các kỹ thuật kỹ thuật tính năng không phá hủy ý nghĩa của các tính năng cơ bản trong khi cũng có thể áp dụng cho các miền tùy ý (hoặc ít nhất là một loạt các miền)?