Cá nhân, tôi muốn chia lựa chọn tính năng thành hai:
- lựa chọn tính năng không giám sát
- lựa chọn tính năng giám sát
Lựa chọn tính năng không được giám sát là những thứ như phân cụm hoặc PCA nơi bạn chọn phạm vi tính năng ít dư thừa nhất (hoặc tạo các tính năng có ít dự phòng). Lựa chọn tính năng được giám sát là những thứ như Lasso nơi bạn chọn các tính năng có sức mạnh dự đoán nhất.
Cá nhân tôi thường thích những gì tôi gọi là lựa chọn tính năng được giám sát. Vì vậy, khi sử dụng hồi quy tuyến tính, tôi sẽ chọn các tính năng dựa trên Lasso. Các phương pháp tương tự tồn tại để gây ra sự thưa thớt trong các mạng lưới thần kinh.
Nhưng thực sự, tôi không thấy cách tôi sẽ thực hiện điều đó trong một phương thức sử dụng hạt nhân, vì vậy có lẽ bạn nên sử dụng cái mà tôi gọi là lựa chọn tính năng không giám sát.
EDIT: bạn cũng đã hỏi về chính quy. Tôi thấy việc chính quy hóa là chủ yếu vì chúng tôi làm việc với các mẫu hữu hạn và vì vậy phân phối đào tạo và kiểm tra sẽ luôn khác nhau đôi chút và bạn muốn mô hình của mình không phù hợp. Tôi không chắc chắn nó sẽ loại bỏ sự cần thiết phải tránh lựa chọn các tính năng (nếu bạn thực sự có quá nhiều). Tôi nghĩ rằng việc chọn các tính năng (hoặc tạo một tập hợp con nhỏ hơn của chúng) sẽ giúp bằng cách làm cho các tính năng bạn làm trở nên mạnh mẽ hơn và tránh mô hình để học hỏi từ các mối tương quan giả. Vì vậy, chính quy hóa có ích, nhưng không chắc chắn rằng nó là một sự thay thế hoàn toàn. Nhưng tôi chưa nghĩ đủ kỹ về điều này.