Làm thế nào một người có thể khách quan (đọc "theo thuật toán") chọn một mô hình thích hợp để thực hiện hồi quy bình phương tuyến tính nhỏ nhất đơn giản với hai biến?
Ví dụ, giả sử dữ liệu dường như hiển thị xu hướng bậc hai và một parabola được tạo ra phù hợp với dữ liệu khá tốt. Làm thế nào để chúng ta biện minh làm cho điều này hồi quy? Hoặc làm thế nào để chúng ta loại bỏ khả năng có một mô hình tốt hơn?
Điều tôi thực sự lo lắng là đây: chúng tôi chỉ có thể tiếp tục thêm các thuật ngữ đa thức cho đến khi chúng tôi có một sự phù hợp hoàn hảo cho tập dữ liệu (nội suy các điểm), không có lỗi gì. Nhưng điều này sẽ vô ích khi dự đoán hoặc ngoại suy, bởi vì sẽ không có lý do gì để nghĩ rằng "mô hình" là thực sự phù hợp. Vậy làm thế nào để một người cân bằng nhu cầu của sự chính xác và hấp dẫn trực quan?
(Ngoài ra, vui lòng thông báo cho tôi nếu điều này đã được hỏi trước đó. Tôi cho rằng nó sẽ xảy ra nhưng không tìm thấy gì.)