Tôi có một câu hỏi liên quan đến việc cần sử dụng các phương pháp lựa chọn tính năng (Rừng ngẫu nhiên có giá trị quan trọng hoặc phương pháp lựa chọn tính năng Univariate, v.v.) trước khi chạy thuật toán học thống kê.
Chúng tôi biết để tránh bị quá mức, chúng tôi có thể đưa ra hình phạt chính quy trên các vectơ trọng lượng.
Vì vậy, nếu tôi muốn thực hiện hồi quy tuyến tính, thì tôi có thể giới thiệu các tham số chính quy hóa mạng L2 hoặc L1 hoặc thậm chí đàn hồi. Để có được các giải pháp thưa thớt, hình phạt L1 giúp lựa chọn tính năng.
Sau đó, nó vẫn được yêu cầu thực hiện lựa chọn tính năng trước khi chạy hồi quy chính quy hóa L1 như Lasso?. Về mặt kỹ thuật Lasso đang giúp tôi giảm các tính năng bằng hình phạt L1 thì tại sao lựa chọn tính năng cần thiết trước khi chạy thuật toán?
Tôi đọc một bài báo nghiên cứu nói rằng làm Anova sau đó SVM cho hiệu suất tốt hơn so với chỉ sử dụng SVM. Bây giờ câu hỏi là: SVM vốn đã thực hiện chính quy hóa bằng cách sử dụng định mức L2. Để tối đa hóa lề, nó đang giảm thiểu định mức vectơ trọng lượng. Vì vậy, nó đang thực hiện chính quy trong chức năng khách quan của nó. Vậy thì các thuật toán kỹ thuật như SVM không nên bị làm phiền về các phương pháp lựa chọn tính năng?. Nhưng báo cáo vẫn cho biết thực hiện lựa chọn Tính năng Univariate trước khi SVM bình thường mạnh hơn.
Bất cứ ai có suy nghĩ?