Làm thế nào là nội suy liên quan đến khái niệm hồi quy?


17

Giải thích ngắn gọn Ý nghĩa của phép nội suy. Làm thế nào nó liên quan đến khái niệm hồi quy?

phép nội suy là nghệ thuật đọc giữa các dòng của bảng và trong toán học tiểu học, thuật ngữ này thường biểu thị quá trình tính toán các giá trị trung gian của hàm từ một tập hợp các giá trị đã cho hoặc dạng bảng của hàm đó.

Tôi không thể đưa ra câu trả lời của câu hỏi thứ hai. Xin vui lòng giúp đỡ


4
Hồi quy nhằm xác định một hàm để mô tả giá trị mong đợi của (biến phụ thuộc) cho X (các biến độc lập). Interpolation sử dụng hồi quy cho việc dự đoán giá trị của Y ở giá trị nhất định của X . Sự khác biệt là tinh tế nhưng xuất hiện trước trong các mô hình trong đó các Y tương quan, bởi vì sau đó các giá trị dự đoán thường khác với giá trị hồi quy của chúng. Cả hồi quy và dự đoán đều không áp dụng trực tiếp vào nội suy trong các bảng toán học, thường được coi là không có lỗi ngẫu nhiên, nhưng thuật toán của chúng vẫn có thể được sử dụng. YXYXY
whuber

2
Đây có phải là công việc cho một số lớp học?
Glen_b -Reinstate Monica

Câu trả lời:


23

Sự khác biệt chính giữa nội suy và hồi quy, là định nghĩa của vấn đề họ giải quyết.

Cho điểm dữ liệu, khi bạn nội suy, bạn tìm một hàm có một số dạng được xác định trước có các giá trị trong các điểm đó chính xác như được chỉ định. Điều đó có nghĩa là các cặp đã cho ( x i , y i ) bạn tìm F của một số dạng được xác định trước thỏa mãn F ( x i ) = y i . Tôi nghĩ rằng phổ biến nhất F được chọn là đa thức, spline (đa thức mức độ thấp trong khoảng giữa các điểm nhất định).n(xi,yi)FF(xi)=yiF

Khi bạn thực hiện hồi quy, bạn tìm kiếm một hàm giảm thiểu một số chi phí, thường là tổng bình phương của các lỗi. Bạn không yêu cầu hàm phải có các giá trị chính xác tại các điểm đã cho, bạn chỉ muốn một phép ước lượng tốt. Nói chung, hàm tìm thấy của bạn có thể không thỏa mãn F ( x i ) = y i cho bất kỳ điểm dữ liệu nào, nhưng hàm chi phí, tức là n i = 1 ( F ( x i ) - y i ) 2 sẽ nhỏ nhất có thể của tất cả các chức năng của hình thức nhất định.FF(xi)=yii=1n(F(xi)yi)2

Một ví dụ điển hình cho lý do tại sao bạn có thể chỉ muốn aproximate thay vì nội suy là giá trên thị trường chứng khoán. Bạn có thể lấy giá trong một số đơn vị thời gian gần đây và cố gắng nội suy chúng để có được một số dự đoán về giá trong đơn vị thời gian tiếp theo. Đây là một ý tưởng tồi, bởi vì không có lý do gì để nghĩ rằng mối quan hệ giữa giá cả có thể được thể hiện chính xác bằng một đa thức. Nhưng hồi quy tuyến tính có thể tạo ra mánh khóe, vì giá có thể có một số "độ dốc" và hàm tuyến tính có thể là một phép tính gần đúng, ít nhất là tại địa phương (gợi ý: không dễ dàng gì, nhưng hồi quy chắc chắn là một ý tưởng tốt hơn so với nội suy trong trường hợp này ).k


Câu trả lời tốt đẹp. Tôi sẽ nói thêm rằng với hồi quy, có một mô hình thống kê đằng sau nó xác định mối quan hệ giữa X theo một số phân phối, trong đó chúng tôi ước tính nó có nghĩa là (hoặc trung bình hoặc lượng tử, v.v. trong các hương vị khác nhau của hồi quy), ví dụ: thống kê .stackexchange.com / thắc mắc / 173.660 / ...YX
Tim

Chẳng phải ví dụ bạn đã mô tả là ngoại suy chứ không phải nội suy?
bi_scholar

6

Hai câu trả lời trước đã giải thích mối quan hệ giữa nội suy tuyến tính và hồi quy tuyến tính (hoặc thậm chí nội suy tổng quát và hồi quy đa thức). Nhưng một kết nối quan trọng là một khi bạn phù hợp với mô hình hồi quy, bạn có thể sử dụng nó để nội suy giữa các điểm dữ liệu đã cho.


Vì vậy, khi tôi thụt lùi, giả sử, chiều cao so với giới tính tôi có thể nội suy để tìm chiều cao dự kiến ​​của một nửa nam, nửa nữ! Ví dụ huyền ảo này làm nổi bật lỗ hổng cơ bản trong phản hồi này, đó là giả định rằng tất cả các biến hồi quy trong mô hình hồi quy phải là các biến liên tục.
whuber

2
Câu trả lời của tôi áp dụng khi tất cả các biến dự đoán liên tục ..
Michael R. Chernick 18/03/18

4

Hy vọng điều này sẽ đến khá nhanh với một ví dụ đơn giản và trực quan.

Giả sử bạn có dữ liệu sau:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

Chúng tôi có thể sử dụng hồi quy để mô hình Y làm phản hồi cho X. Sử dụng R: lm(y ~ x)

Kết quả là một đánh chặn 5 và hệ số cho x là 1. Điều đó có nghĩa là một Y tùy ý có thể được tính cho một X cho trước là X + 5. Như một hình ảnh, bạn có thể thấy theo cách này:

nhập mô tả hình ảnh ở đây

Lưu ý làm thế nào nếu bạn đi đến trục X, bất cứ nơi nào dọc theo nó và vẽ một đường thẳng lên đường được trang bị và sau đó vẽ một đường thẳng đến trục Y, bạn có thể nhận được một giá trị, cho dù tôi có cung cấp điểm giá trị cho hay không Y. Regression đang làm mịn các khu vực không có dữ liệu bằng cách ước tính mối quan hệ cơ bản.


2

Sự khác biệt cơ bản b / w Nội suy và hồi quy như sau: Nội suy: giả sử có n điểm (ví dụ: 10 điểm dữ liệu), trong phép nội suy, chúng ta sẽ khớp đường cong đi qua tất cả các điểm dữ liệu (ví dụ ở đây là 10 điểm dữ liệu) với a mức độ của đa thức (no.of điểm dữ liệu -1; tức là ở đây là 9). Ở đây, trong hồi quy không phải tất cả các điểm dữ liệu chỉ cần một tập hợp các điểm cần thiết cho khớp đường cong.

nói chung, thứ tự của Nội suy & hồi quy sẽ là (1,2 hoặc 3) nếu thứ tự lớn hơn 3, sẽ có nhiều dao động hơn được nhìn thấy trong đường cong.


2
Điều này ngụ ý rằng phép nội suy dựa trên đa thức, nhưng có một số phương pháp khác, chẳng hạn như spline khối, piecewise cub Hermite, hàng xóm gần nhất, v.v.
Nick Cox

@Nick Mặc dù bạn đã đúng, nhưng thật tò mò rằng mọi phương pháp bạn đặt tên thực sự đều dựa trên đa thức! Có lẽ bộ nội suy không đa thức đơn giản nhất, nổi tiếng nhất là trọng số khoảng cách nghịch đảo (IDW).
whuber

@whuber Đồng ý; nếu đa thức có thể được áp dụng với các ràng buộc, thì hầu hết các phương thức đều đủ điều kiện, ví dụ: hàng xóm gần nhất = hằng số piecewise, v.v.
Nick Cox

2

Hồi quy là quá trình tìm dòng phù hợp nhất [1]. Nội suy là quá trình sử dụng dòng phù hợp nhất để ước tính giá trị của một biến từ giá trị của biến khác, với điều kiện giá trị bạn đang sử dụng nằm trong phạm vi dữ liệu của bạn. Nếu nó nằm ngoài phạm vi, thì bạn sẽ sử dụng Phép ngoại suy [1].

[1] http://mathhelpforum.com/advified-applied-math/182558-interpolation-vs-regression.html


2
Câu trả lời này không phân biệt phép nội suy với phép ngoại suy. Bạn có duy trì chúng là những điều tương tự? BTW, các diễn đàn toán học (và sách giáo khoa và bài báo, thậm chí) nói chung không phải là nguồn thông tin tốt về các vấn đề thống kê, bởi vì chúng có xu hướng tập trung vào ý nghĩa toán học hẹp - mặc dù đúng và hữu ích trong các ứng dụng toán học thuần túy - có thể không áp dụng rộng rãi hơn .
whuber

1

Với phép nội suy hoặc khớp nối spline, những gì chúng ta nhận được là một dữ liệu số (đặt cược nội suy vào từng cặp dữ liệu gốc) có kích thước lớn hơn, khi được vẽ sẽ tạo ra hiệu ứng của một đường cong trơn tru. Trong thực tế, giữa mỗi cặp dữ liệu gốc, một đa thức khác nhau được trang bị, do đó toàn bộ đường cong sau khi nội suy là một đường cong liên tục khôn ngoan, trong đó mỗi phần được tạo thành một đa thức khác nhau.

Nếu một người đang tìm kiếm biểu diễn tham số của dữ liệu số gốc, hồi quy phải được thực hiện. Bạn cũng có thể cố gắng để phù hợp với một đa thức mức độ cao cho spline. Trong mọi trường hợp, đại diện sẽ là một xấp xỉ. Bạn cũng có thể kiểm tra độ chính xác gần đúng.


Có vẻ như bạn chưa có cơ hội đọc bình luận của Nick Cox , điều này chỉ ra rằng không phải tất cả các phép nội suy đều là đa thức (cục bộ).
whuber

0

Cả hồi quy và nội suy đều được sử dụng để dự đoán các giá trị của một biến (Y) cho một giá trị đã cho của một biến khác (X). Trong Hồi quy, chúng ta có thể dự đoán bất kỳ giá trị nào của biến phụ thuộc (Y) cho một giá trị đã cho của biến độc lập (X) Ngay cả khi nó nằm ngoài phạm vi của các giá trị được lập bảng. Nhưng trong trường hợp Nội suy, chúng ta chỉ có thể dự đoán các giá trị của biến phụ thuộc (Y) cho một giá trị của biến độc lập (X) nằm trong phạm vi giá trị đã cho của X.


0

Nội suy là quá trình khớp một số điểm giữa x = a và x = b chính xác với đa thức nội suy. Nội suy có thể được sử dụng để tìm giá trị gần đúng (hoặc giá trị còn thiếu) của y trong miền x = [a, b] với độ chính xác tốt hơn kỹ thuật hồi quy.

Mặt khác, hồi quy là một quá trình khớp một số điểm với một đường cong đi qua hoặc gần các điểm với sai số bình phương tối thiểu. Hồi quy sẽ không gần đúng giá trị của y trong miền x = [a, b] chính xác như nội suy, tuy nhiên hồi quy cung cấp dự đoán tốt hơn so với nội suy cho các giá trị của y trong miền giữa x = (- vô cực, a) và x = ( b, + vô cùng).

Tóm lại, phép nội suy cung cấp độ chính xác tốt hơn về giá trị của y trong miền của phạm vi x đã biết trong khi hồi quy cung cấp dự đoán tốt hơn về y trong miền bên dưới và ngoài phạm vi đã biết của x.


3
Đây không phải là định nghĩa của phép nội suy mà đa thức được sử dụng. Các chức năng trơn tru khác có thể thích hợp.
Nick Cox

3
Có những vấn đề khác với yêu cầu của bạn. Ví dụ, hồi quy có thể chính xác hơn nội suy. Sự khác biệt thống kê giữa hai thủ tục khá khác so với những gì bạn thể hiện: vui lòng xem các bài viết khác trong chủ đề này.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.