Sự đánh đổi phương sai sai lệch dựa trên sự cố của lỗi bình phương trung bình:
MSE(y^)=E[y−y^]2=E[y−E[y^]]2+E[y^−E[y^]]2
Một cách để xem giao dịch sai lệch thiên vị là những thuộc tính nào của tập dữ liệu được sử dụng trong mô hình phù hợp. Đối với mô hình đơn giản, nếu chúng ta giả sử rằng hồi quy OLS đã được sử dụng để khớp với đường thẳng, thì chỉ có 4 số được sử dụng để khớp với đường thẳng:
- Hiệp phương sai mẫu giữa x và y
- Phương sai mẫu của x
- Giá trị trung bình mẫu của x
- Giá trị trung bình mẫu của y
Vì vậy, bất kỳ biểu đồ nào dẫn đến cùng 4 số ở trên sẽ dẫn đến chính xác cùng một dòng được trang bị (10 điểm, 100 điểm, 100000000 điểm). Vì vậy, theo một nghĩa nào đó, nó không nhạy cảm với mẫu cụ thể được quan sát. Điều này có nghĩa là nó sẽ bị "sai lệch" vì nó thực sự bỏ qua một phần dữ liệu. Nếu phần bị bỏ qua đó của dữ liệu là quan trọng, thì các dự đoán sẽ liên tục bị lỗi. Bạn sẽ thấy điều này nếu bạn so sánh dòng được trang bị bằng cách sử dụng tất cả dữ liệu với các dòng được trang bị thu được từ việc xóa một điểm dữ liệu. Họ sẽ có xu hướng khá ổn định.
Bây giờ mô hình thứ hai sử dụng mọi mẩu dữ liệu mà nó có thể nhận được, và phù hợp với dữ liệu càng gần càng tốt. Do đó, vị trí chính xác của mọi điểm dữ liệu có vấn đề và do đó bạn không thể thay đổi dữ liệu huấn luyện xung quanh mà không thay đổi mô hình được trang bị như bạn có thể cho OLS. Do đó, mô hình rất nhạy cảm với tập huấn luyện cụ thể mà bạn có. Mô hình được trang bị sẽ rất khác nhau nếu bạn thực hiện cùng một biểu đồ điểm dữ liệu thả xuống.