Tôi nghĩ rằng chúng là 2 thứ khác nhau,
Hãy bắt đầu với tính năng Lựa chọn :
Kỹ thuật này được sử dụng để chọn các tính năng giải thích phần lớn biến mục tiêu (có tương quan với biến mục tiêu). Thử nghiệm này được thực hiện ngay trước khi mô hình được áp dụng trên dữ liệu.
Để giải thích rõ hơn, chúng ta hãy đi theo một ví dụ: có 10 tính năng và 1 biến mục tiêu, 9 tính năng giải thích 90% biến mục tiêu và 10 tính năng cùng nhau giải thích 91% biến mục tiêu. Vì vậy, biến 1 không tạo ra nhiều khác biệt nên bạn có xu hướng loại bỏ biến đó trước khi lập mô hình (Nó cũng mang tính chủ quan đối với doanh nghiệp). Tôi cũng có thể được gọi là Tầm quan trọng dự đoán.
Bây giờ hãy nói về Khai thác tính năng ,
Được sử dụng trong Học tập không giám sát, trích xuất các đường viền trong hình ảnh, trích xuất Bi-gram từ một văn bản, trích xuất các âm vị từ ghi âm văn bản nói. Khi bạn không biết gì về dữ liệu như không có từ điển dữ liệu, có quá nhiều tính năng có nghĩa là dữ liệu không ở định dạng dễ hiểu. Sau đó, bạn thử áp dụng kỹ thuật này để có được một số tính năng giải thích hầu hết dữ liệu. Khai thác tính năng liên quan đến việc chuyển đổi các tính năng, thường không thể đảo ngược do một số thông tin bị mất trong quá trình giảm kích thước.
Bạn có thể áp dụng Trích xuất tính năng trên dữ liệu đã cho để trích xuất các tính năng và sau đó áp dụng Tính năng chọn đối với Biến mục tiêu để chọn tập hợp con có thể giúp tạo ra một mô hình tốt với kết quả tốt.
bạn có thể đi qua các Link-1 , Link-2 này để hiểu rõ hơn.
chúng ta có thể thực hiện chúng trong R, Python, SPSS.
cho tôi biết nếu cần làm rõ thêm.