Tôi đang cố gắng tạo một mô hình rút gọn để dự đoán nhiều biến phụ thuộc (DV) (~ 450) có tương quan cao.
Các biến độc lập của tôi (IV) cũng rất nhiều (~ 2000) và có mối tương quan cao.
Nếu tôi sử dụng Lasso để chọn một mô hình rút gọn cho từng đầu ra riêng lẻ, tôi không được đảm bảo có cùng một tập hợp con của các biến độc lập khi tôi lặp qua từng biến phụ thuộc.
Có một hồi quy tuyến tính đa biến sử dụng Lasso trong R không?
Đây không phải là nhóm Lasso. nhóm lasso nhóm IV. Tôi muốn hồi quy tuyến tính đa biến (có nghĩa là DV là một ma trận, không phải là một vectơ vô hướng), cũng thực hiện lasso. (Lưu ý: như NRH chỉ ra, điều này không đúng. Nhóm lasso là một thuật ngữ chung bao gồm các chiến lược nhóm IV, nhưng cũng bao gồm các chiến lược nhóm các tham số khác như DV)
Tôi tìm thấy bài báo này được đưa vào một cái gì đó gọi là Bộ chồng chéo thưa thớt Lasso
Đây là một số mã thực hiện hồi quy tuyến tính đa biến
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
Đây là một số mã mà lasso trên một DV
> fit = glmnet(dictionary, target[,1])
Và đây là những gì tôi muốn làm:
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
Chọn các tính năng phù hợp với TẤT CẢ các mục tiêu cùng một lúc
glmnet
và nó có một họa tiết kỹ lưỡng.