Tôi đang làm việc trên một mô hình chi phí dự đoán trong đó tuổi của bệnh nhân (số lượng nguyên được đo bằng năm) là một trong những biến dự đoán. Một mối quan hệ phi tuyến mạnh mẽ giữa tuổi và nguy cơ nằm viện là điều hiển nhiên:
Tôi đang xem xét một spline làm mịn hồi quy bị phạt cho tuổi bệnh nhân. Theo The Elements of Statistics Learning (Hastie et al, 2009, tr.151), vị trí nút tối ưu là một nút trên mỗi giá trị duy nhất của tuổi thành viên.
Cho rằng tôi đang giữ tuổi như một số nguyên, liệu spline làm mịn bị phạt có tương đương với chạy hồi quy sườn hoặc lasso với 101 biến chỉ báo tuổi khác biệt, một giá trị theo tuổi được tìm thấy trong tập dữ liệu (trừ một giá trị tham chiếu) không? Sau đó, vượt quá tham số được tránh vì các hệ số trên mỗi chỉ số tuổi được thu nhỏ về 0.