Sự khác biệt chính giữa nội suy và hồi quy, là định nghĩa của vấn đề họ giải quyết.
Cho điểm dữ liệu, khi bạn nội suy, bạn tìm một hàm có một số dạng được xác định trước có các giá trị trong các điểm đó chính xác như được chỉ định. Điều đó có nghĩa là các cặp đã cho ( x i , y i ) bạn tìm F của một số dạng được xác định trước thỏa mãn F ( x i ) = y i . Tôi nghĩ rằng phổ biến nhất F được chọn là đa thức, spline (đa thức mức độ thấp trong khoảng giữa các điểm nhất định).n(xi,yi)FF(xi)=yiF
Khi bạn thực hiện hồi quy, bạn tìm kiếm một hàm giảm thiểu một số chi phí, thường là tổng bình phương của các lỗi. Bạn không yêu cầu hàm phải có các giá trị chính xác tại các điểm đã cho, bạn chỉ muốn một phép ước lượng tốt. Nói chung, hàm tìm thấy của bạn có thể không thỏa mãn F ( x i ) = y i cho bất kỳ điểm dữ liệu nào, nhưng hàm chi phí, tức là ∑ n i = 1 ( F ( x i ) - y i ) 2 sẽ nhỏ nhất có thể của tất cả các chức năng của hình thức nhất định.FF(xi)=yiΣni = 1( F( xTôi) - yTôi)2
Một ví dụ điển hình cho lý do tại sao bạn có thể chỉ muốn aproximate thay vì nội suy là giá trên thị trường chứng khoán. Bạn có thể lấy giá trong một số đơn vị thời gian gần đây và cố gắng nội suy chúng để có được một số dự đoán về giá trong đơn vị thời gian tiếp theo. Đây là một ý tưởng tồi, bởi vì không có lý do gì để nghĩ rằng mối quan hệ giữa giá cả có thể được thể hiện chính xác bằng một đa thức. Nhưng hồi quy tuyến tính có thể tạo ra mánh khóe, vì giá có thể có một số "độ dốc" và hàm tuyến tính có thể là một phép tính gần đúng, ít nhất là tại địa phương (gợi ý: không dễ dàng gì, nhưng hồi quy chắc chắn là một ý tưởng tốt hơn so với nội suy trong trường hợp này ).k