Giả sử bạn muốn để ước lượng một mô hình tuyến tính: ( quan sát phản ứng, và dự đoán)
Một cách để làm điều này là thông qua giải pháp OLS, tức là chọn các hệ số sao cho tổng các lỗi bình phương là tối thiểu:
Ngoài ra, bạn có thể sử dụng một hàm mất mát khác, như tổng độ lệch tuyệt đối, sao cho:
Giả sử bạn đã tìm thấy các tham số cho hai mô hình và muốn chọn mô hình có giá trị nhỏ nhất của hàm mất. Làm thế nào bạn có thể so sánh các giá trị tối thiểu đạt được bởi các hàm mất nói chung? (tức là không chỉ trường hợp cụ thể này - chúng ta cũng có thể thử các hàm mất dựa trên L_p khác ) Dường như có sự khác biệt về quy mô của các hàm - một giao dịch với các ô vuông trong khi các hàm khác thì không.