Tôi đang cố gắng mô hình hóa một số dữ liệu bằng cách sử dụng glmnet
gói trong R. Giả sử tôi có dữ liệu sau
training_x <- data.frame(variable1 = c(1, 2, 3, 2, 3),
variable2 = c(1, 2, 3, 4, 5))
y <- c(1, 2, 3, 4, 5)
(Đây là một sự đơn giản hóa; dữ liệu của tôi phức tạp hơn nhiều.) Sau đó, tôi đã sử dụng đoạn mã sau để tạo mô hình glmnet.
x <- as.matrix(training_x)
library(glmnet)
GLMnet_model_1 <- glmnet(x, y, family="gaussian", alpha=0.755,
nlambda=1000, standardize=FALSE, maxit=100000)
Tôi đang sử dụng standardize=FALSE
vì dữ liệu thực tế của tôi đã được chuẩn hóa. Sau đó, tôi muốn đưa ra dự đoán về một bộ dữ liệu mới. Giả sử dữ liệu mới của tôi là:
newdata <- as.matrix(data.frame(variable1 = c(2, 2, 1, 3),
variable2 = c(6, 2, 1, 3)))
results <- predict(object=GLMnet_model_1, newx, type="response")
Tôi mong đợi kết quả chứa 4 yếu tố (dự đoán của newdata
), nhưng thay vào đó, nó mang lại cho tôi ma trận 4x398. Tôi đang làm gì sai?