Xyλ∥β∗∥2β∗iX
β∗i=sign(βLSi)(βLSi−λ)+
β∗ℓ1∥β∗∥2
Trên thực tế, Hastie et al. được đề cập trong bài báo Chuyển tiếp hồi quy theo giai đoạn và Lasso đơn điệu , một điều kiện cần và đủ về tính đơn điệu của các đường dẫn hồ sơ:
Trong Phần 6 của bài báo, họ đã xây dựng một bộ dữ liệu nhân tạo dựa trên các hàm cơ sở tuyến tính từng phần vi phạm điều kiện trên, cho thấy tính không đơn điệu. Nhưng nếu chúng ta gặp may mắn, chúng ta cũng có thể tạo một tập dữ liệu ngẫu nhiên thể hiện hành vi tương tự nhưng theo cách đơn giản hơn. Đây là mã R của tôi:
library(glmnet)
set.seed(0)
N <- 10
p <- 15
x1 <- rnorm(N)
X <- mat.or.vec(N, p)
X[, 1] <- x1
for (i in 2:p) {X[, i] <- x1 + rnorm(N, sd=0.2)}
beta <- rnorm(p, sd=10)
y <- X %*% beta + rnorm(N, sd=0.01)
model <- glmnet(X, y, family="gaussian", alpha=1, intercept=FALSE)
Xββ∗
λ∥β∗∥2
λ∥β∗∥2λ