Tôi giả sử bạn có nghĩa là lựa chọn tính năng như kỹ thuật tính năng . Quá trình tôi thường làm theo và tôi thấy một số người làm là
- Kỹ thuật tính năng
Hãy thử một vài thuật toán, thường là các thuật toán có hiệu suất cao như RandomForest, Gradient Boosted Tree, Neutral Networks hoặc SVM trên các tính năng.
2.1 Thực hiện điều chỉnh tham số đơn giản như tìm kiếm lưới trên một phạm vi nhỏ các tham số
Nếu kết quả của bước 2 không thỏa đáng, hãy quay lại bước 1 để tạo thêm các tính năng hoặc xóa các tính năng dư thừa và giữ các tính năng tốt nhất, mọi người thường gọi lựa chọn tính năng này . Nếu hết ý tưởng cho các tính năng mới, hãy thử nhiều thuật toán hơn.
Nếu kết quả ổn hoặc gần với những gì bạn muốn, sau đó chuyển sang bước 3
- Điều chỉnh tham số mở rộng
Lý do để làm điều này là phân loại là tất cả về kỹ thuật tính năng , và trừ khi bạn biết một số phân loại mạnh mẽ đáng kinh ngạc như học sâu tùy chỉnh cho một vấn đề cụ thể, chẳng hạn như Computer Vision. Tạo các tính năng tốt là chìa khóa. Chọn một phân loại là quan trọng nhưng không quan trọng. Tất cả các phân loại được đề cập ở trên là khá tương đương về hiệu suất, và hầu hết thời gian, phân loại tốt nhất hóa ra là một trong số chúng.
Điều chỉnh tham số có thể tăng hiệu suất, trong một số trường hợp, khá nhiều. Nhưng không có các tính năng tốt, điều chỉnh không giúp được nhiều. Hãy nhớ rằng, bạn luôn có thời gian để điều chỉnh tham số. Ngoài ra, không có điểm điều chỉnh tham số rộng rãi sau đó bạn khám phá một tính năng mới và làm lại toàn bộ.