Mô hình nào là "mô hình phù hợp nhất" tùy thuộc vào ý bạn muốn nói "tốt nhất". R có các công cụ để trợ giúp, nhưng bạn cần cung cấp định nghĩa cho "tốt nhất" để lựa chọn giữa chúng. Hãy xem xét dữ liệu và mã ví dụ sau:
x <- 1:10
y <- x + c(-0.5,0.5)
plot(x,y, xlim=c(0,11), ylim=c(-1,12))
fit1 <- lm( y~offset(x) -1 )
fit2 <- lm( y~x )
fit3 <- lm( y~poly(x,3) )
fit4 <- lm( y~poly(x,9) )
library(splines)
fit5 <- lm( y~ns(x, 3) )
fit6 <- lm( y~ns(x, 9) )
fit7 <- lm( y ~ x + cos(x*pi) )
xx <- seq(0,11, length.out=250)
lines(xx, predict(fit1, data.frame(x=xx)), col='blue')
lines(xx, predict(fit2, data.frame(x=xx)), col='green')
lines(xx, predict(fit3, data.frame(x=xx)), col='red')
lines(xx, predict(fit4, data.frame(x=xx)), col='purple')
lines(xx, predict(fit5, data.frame(x=xx)), col='orange')
lines(xx, predict(fit6, data.frame(x=xx)), col='grey')
lines(xx, predict(fit7, data.frame(x=xx)), col='black')
Mô hình nào trong số đó là tốt nhất? đối số có thể được thực hiện cho bất kỳ đối số nào trong số chúng (nhưng tôi đối với một đối số sẽ không muốn sử dụng đối số màu tím để nội suy).