Khía cạnh quan trọng nhất của phép nội suy và khớp đường cong là để hiểu tại sao sự phù hợp đa thức bậc cao có thể là một vấn đề và các tùy chọn khác là gì và sau đó bạn có thể hiểu khi nào chúng không phải là một lựa chọn tốt.
Một vài vấn đề với đa thức bậc cao:
Đa thức là các hàm dao động tự nhiên. Khi thứ tự của đa thức tăng, số lượng dao động tăng lên và những dao động này trở nên nghiêm trọng hơn. Tôi đang đơn giản hóa ở đây, khả năng nhiều gốc và tưởng tượng làm cho nó phức tạp hơn một chút, nhưng điểm giống nhau.
Đa thức tiếp cận +/- vô cực với tốc độ bằng thứ tự đa thức khi x đi tới +/- vô cùng. Đây thường không phải là một hành vi mong muốn.
Tính hệ số đa thức cho đa thức bậc cao thường là một vấn đề không có điều kiện. Điều này có nghĩa là các lỗi nhỏ (chẳng hạn như làm tròn trong máy tính của bạn) có thể tạo ra những thay đổi lớn trong câu trả lời. Hệ thống tuyến tính phải được giải quyết liên quan đến Ma trận Vandermonde có thể dễ dàng bị điều hòa.
Tôi nghĩ rằng có lẽ cốt lõi của vấn đề này là sự phân biệt giữa khớp đường cong và nội suy .
Nội suy được sử dụng khi bạn tin rằng dữ liệu của bạn rất chính xác nên bạn muốn chức năng của mình khớp chính xác với các điểm dữ liệu. Khi bạn cần các giá trị giữa các điểm dữ liệu của mình, tốt nhất là sử dụng chức năng trơn tru phù hợp với xu hướng cục bộ của dữ liệu. Các spline hình khối hoặc Hermite thường là một lựa chọn tốt cho loại vấn đề này vì chúng ít nhạy cảm hơn với các điểm không cục bộ (nghĩa là tại các điểm dữ liệu cách xa một điểm nhất định) thay đổi hoặc lỗi trong dữ liệu và ít dao động hơn so với đa thức. Hãy xem xét các tập dữ liệu sau:
x = 1 2 3 4 5 6 7 8 9 10
y = 1 1 1.1 1 1 1 1 1 1 1
Một sự phù hợp đa thức có dao động lớn hơn nhiều, đặc biệt là gần các cạnh của tập dữ liệu, hơn là một spline Hermite.
Mặt khác, xấp xỉ bình phương tối thiểu là khớp đường congkỹ thuật. Phù hợp đường cong được sử dụng khi bạn có một số ý tưởng về chức năng dự kiến của dữ liệu của mình, nhưng bạn không cần chức năng của mình để vượt qua chính xác tất cả các điểm dữ liệu. Điều này là điển hình khi dữ liệu có thể chứa lỗi đo lường hoặc các quy định khác hoặc khi bạn muốn trích xuất xu hướng chung của dữ liệu. Xấp xỉ xấp xỉ bình phương thường được giới thiệu nhất trong một khóa học bằng cách sử dụng đa thức cho khớp đường cong vì điều này dẫn đến một hệ thống tuyến tính tương đối đơn giản để giải quyết bằng cách sử dụng các kỹ thuật bạn có thể học trước đó trong khóa học. Tuy nhiên, các kỹ thuật bình phương tối thiểu là tổng quát hơn nhiều so với chỉ phù hợp đa thức và có thể được sử dụng để phù hợp với bất kỳ chức năng mong muốn nào đối với tập dữ liệu. Ví dụ: nếu bạn mong đợi xu hướng tăng trưởng theo cấp số nhân trong tập dữ liệu của mình,
Cuối cùng, việc chọn hàm chính xác để phù hợp với dữ liệu của bạn cũng quan trọng như thực hiện chính xác phép tính nội suy hoặc phép tính bình phương nhỏ nhất. Làm như vậy thậm chí cho phép khả năng ngoại suy (thận trọng). Hãy xem xét tình huống sau đây. Dữ liệu dân số (tính bằng triệu người) cho Hoa Kỳ từ 2000-2010:
Year: 2000 2001 2002 2003 2004 2005 2006 2007 2008 2010
Pop.: 284.97 287.63 290.11 292.81 295.52 298.38 301.23 304.09 306.77 309.35
Sử dụng một bình phương tối thiểu tuyến tính theo cấp số nhân phù hợp N(t)=A*exp(B*t)
hoặc phép nội suy đa thức bậc 10 cho kết quả như sau:
Tăng trưởng dân số Hoa Kỳ không hoàn toàn theo cấp số nhân, nhưng tôi sẽ để bạn là người đánh giá mức độ phù hợp hơn.