Tôi có thể đang xử lý một vấn đề có thể đã được giải quyết hàng trăm lần trước đây, nhưng tôi không biết tìm câu trả lời ở đâu.
Khi sử dụng hồi quy logistic, được cung cấp nhiều tính năng và cố gắng dự đoán giá trị phân loại nhị phân , tôi quan tâm đến việc chọn một tập hợp con các tính năng dự đoán tốt. y y
Có một quy trình tương tự như Lasso có thể được sử dụng? (Tôi chỉ thấy lasso được sử dụng cho hồi quy tuyến tính.)
Là nhìn vào các hệ số của mô hình được trang bị cho thấy tầm quan trọng của các tính năng khác nhau?
Chỉnh sửa - Làm rõ sau khi xem một số câu trả lời:
Khi tôi đề cập đến độ lớn của các hệ số được trang bị, tôi có nghĩa là những hệ số được trang bị cho các tính năng chuẩn hóa (trung bình 0 và phương sai 1). Mặt khác, như @probabilityislogic đã chỉ ra, 1000x sẽ xuất hiện ít quan trọng hơn x.
Tôi không quan tâm đến việc đơn giản là tìm tập hợp con k tốt nhất (như @Davide đã cung cấp), nhưng cân nhắc tầm quan trọng của các tính năng khác nhau so với nhau. Ví dụ: một tính năng có thể là "tuổi" và tính năng khác "tuổi> 30". Tầm quan trọng gia tăng của họ có thể ít, nhưng cả hai có thể quan trọng.