Tôi không có một ví dụ cụ thể hoặc nhiệm vụ trong tâm trí. Tôi chỉ mới sử dụng b-splines và tôi muốn hiểu rõ hơn về chức năng này trong bối cảnh hồi quy.
Giả sử rằng chúng tôi muốn đánh giá mối quan hệ giữa biến trả lời và một số dự đoán . Các dự đoán bao gồm một số biến số cũng như một số biến phân loại.
Giả sử sau khi điều chỉnh mô hình hồi quy, một trong các biến số, ví dụ là có ý nghĩa. Một bước hợp lý sau đó là đánh giá xem các đa thức bậc cao hơn, ví dụ: và được yêu cầu để giải thích thỏa đáng mối quan hệ mà không cần quá mức.
Câu hỏi của tôi là:
Tại thời điểm nào bạn đã chọn giữa b-splines hoặc đa thức bậc cao đơn giản. ví dụ: trong R:
y ~ poly(x1,3) + x2 + x3
đấu với
y ~ bs(x1,3) + x2 + x3
Làm thế nào bạn có thể sử dụng các lô để thông báo sự lựa chọn của mình giữa hai thứ đó và điều gì xảy ra nếu nó không thực sự rõ ràng từ các lô (ví dụ: do số lượng điểm dữ liệu khổng lồ)
Bạn đánh giá các điều khoản tương tác hai chiều giữa và giả sử
Làm thế nào để thay đổi ở trên cho các loại mô hình khác nhau
Bạn có cân nhắc không bao giờ sử dụng đa thức bậc cao và luôn lắp b-splines và xử phạt tính linh hoạt cao không?
mgcv
, tại sao không sử dụng mô hình phụ gia (tổng quát). Lựa chọn độ mịn là tự động, và các phương pháp suy luận được phát triển tốt.