Giả sử chúng ta có các điểm dữ liệu đầu vào (dự đoán) và đầu ra (phản hồi) A, B, C, D, E và chúng ta muốn khớp một đường qua các điểm. Đây là một vấn đề đơn giản để minh họa cho câu hỏi, nhưng cũng có thể được mở rộng sang kích thước cao hơn.
Báo cáo vấn đề
Giả thuyết phù hợp nhất hoặc hiện tại được thể hiện bằng đường màu đen ở trên. Mũi tên màu xanh ( ) biểu thị khoảng cách dọc giữa điểm dữ liệu và mức phù hợp nhất hiện tại, bằng cách vẽ một đường thẳng đứng từ điểm cho đến khi nó giao nhau với đường.
Mũi tên màu xanh lá cây ( ) được vẽ sao cho vuông góc với giả thuyết hiện tại tại điểm giao nhau và do đó biểu thị khoảng cách nhỏ nhất giữa điểm dữ liệu và giả thuyết hiện tại. Đối với các điểm A và B, một đường được vẽ sao cho thẳng đứng với dự đoán tốt nhất hiện tại và tương tự như một đường thẳng đứng với trục x. Đối với hai điểm này, các đường màu xanh lam và xanh lục trùng nhau, nhưng chúng không cho các điểm C, D và E.
Nguyên tắc bình phương nhỏ nhất xác định hàm chi phí cho hồi quy tuyến tính bằng cách vẽ một đường thẳng đứng qua các điểm dữ liệu (A, B, C, D hoặc E) cho giả thuyết ước tính ( ), tại bất kỳ chu kỳ đào tạo cụ thể nào và được đại diện bởi
Ở đây đại diện cho các điểm dữ liệu và đại diện cho sự phù hợp nhất.
Khoảng cách tối thiểu giữa một điểm (A, B, C, D hoặc E) được biểu thị bằng một đường vuông góc được vẽ từ điểm đó đến dự đoán tốt nhất hiện tại (mũi tên màu xanh lá cây).
Mục tiêu của hàm bình phương tối thiểu là xác định hàm mục tiêu mà khi được tối thiểu hóa sẽ tạo ra khoảng cách nhỏ nhất giữa giả thuyết và tất cả các điểm kết hợp, nhưng sẽ nhất thiết phải giảm thiểu khoảng cách giữa giả thuyết và một điểm đầu vào.
** Câu hỏi **
Tại sao chúng ta không định nghĩa Hàm chi phí cho hồi quy tuyến tính là khoảng cách nhỏ nhất giữa điểm dữ liệu đầu vào và giả thuyết (được xác định bởi một đường vuông góc với giả thuyết) đi qua datapoin, như được đưa ra bởi ( )?