Khi tôi sử dụng mô hình hồi quy, tôi cảm thấy không ổn định khi mặc định một giả định về liên kết tuyến tính; thay vào đó, tôi thích khám phá dạng chức năng của mối quan hệ giữa các biến phụ thuộc và biến giải thích bằng cách sử dụng hồi quy làm mịn không theo tỷ lệ (ví dụ: mô hình phụ gia tổng quát , lowess / lowess , làm mịn dòng chạy , v.v.) trước khi ước lượng mô hình tham số sử dụng, như hồi quy bình phương nhỏ nhất để ước tính các tham số cho các hàm được đề xuất bởi mô hình không tham số.
Một cách tốt để suy nghĩ về việc thực hiện xác nhận chéo trong giai đoạn hồi quy làm mịn không theo tỷ lệ của cách tiếp cận như vậy là gì? Tôi tự hỏi liệu tôi có thể gặp phải tình huống trong mẫu giữ ngẫu nhiên Một mối quan hệ xấp xỉ bởi chức năng bản lề tuyến tính "thanh gãy" có thể rõ ràng hay không, trong khi mẫu B giữ lại cho thấy mối quan hệ sẽ được xấp xỉ tốt hơn bởi chức năng bản lề ngưỡng parabol.
Liệu người ta có cách tiếp cận không toàn diện sẽ giữ lại một phần dữ liệu được chọn ngẫu nhiên, thực hiện hồi quy không theo tỷ lệ, giải thích các dạng chức năng hợp lý cho kết quả và lặp lại số lần này (có thể quản lý được) và các dạng chức năng có thể kiểm chứng về mặt tinh thần ?
Hoặc người ta sẽ thực hiện một cách tiếp cận toàn diện (ví dụ LOOCV), và sử dụng một số thuật toán để 'làm mịn tất cả các độ mịn' và sử dụng độ mịn nhất của độ mịn để thông báo các dạng chức năng hợp lý? (Mặc dù, theo phản ánh, tôi nghĩ LOOCV hoàn toàn không có khả năng dẫn đến các mối quan hệ chức năng rất khác nhau vì một dạng chức năng trên một mẫu đủ lớn không có khả năng bị thay đổi bởi một điểm dữ liệu duy nhất.)
Các ứng dụng của tôi thường sẽ đòi hỏi số lượng các biến dự đoán có thể quản lý được của con người (một vài đến vài chục), nhưng kích thước mẫu của tôi sẽ dao động từ vài trăm đến vài trăm nghìn. Mục đích của tôi là tạo ra một mô hình giao tiếp trực quan và dễ dịch có thể được sử dụng để đưa ra dự đoán của những người có tập dữ liệu khác với tôi và không bao gồm các biến kết quả.
Tài liệu tham khảo trong câu trả lời rất hoan nghênh.