Tôi đang xây dựng một hồi quy logistic trong R bằng phương pháp LASSO với các hàm cv.glmnet
để chọn lambda
và glmnet
cho mô hình cuối cùng.
Tôi đã biết tất cả các nhược điểm liên quan đến việc lựa chọn mô hình tự động nhưng dù sao tôi cũng cần phải làm điều đó.
Vấn đề của tôi là tôi cần bao gồm các biến nhân tố (phân loại) trong mô hình, có cách nào để làm điều đó mà không tạo ra nhiều biến giả không? Biến này gần như là tất cả các chuỗi và không phải là số.
2
Tôi tò mò về cách tốt nhất để làm điều này là tốt.
—
bác sĩ lâm sàng