Bất cứ ai cũng có thể giúp đưa ra một lời giải thích khái niệm về cách dự đoán được thực hiện cho dữ liệu mới khi sử dụng mịn / splines cho một mô hình dự đoán? Ví dụ, được đưa ra một mô hình được tạo bằng cách sử dụng gamboost
trong mboost
gói trong R, với p-splines, dự đoán cho dữ liệu mới được thực hiện như thế nào? Những gì được sử dụng từ dữ liệu đào tạo?
Nói rằng có một giá trị mới của biến độc lập x và chúng tôi muốn dự đoán y. Là một công thức để tạo spline được áp dụng cho giá trị dữ liệu mới này bằng cách sử dụng các nút hoặc df được sử dụng khi đào tạo mô hình và sau đó các hệ số từ mô hình được đào tạo được áp dụng để đưa ra dự đoán?
Dưới đây là một ví dụ với R, dự đoán đang làm gì về mặt khái niệm để xuất 899,4139 cho dữ liệu mới mean_radius = 15,99?
#take the data wpbc as example
library(mboost)
data(wpbc)
modNew<-gamboost(mean_area~mean_radius, data = wpbc, baselearner = "bbs", dfbase = 4, family=Gaussian(),control = boost_control(mstop = 5))
test<-data.frame(mean_radius=15.99)
predict(modNew,test)