Tôi đề nghị giảm lỗi . Đây cũng là thuật ngữ được áp dụng trong đoạn 2.1.1 của Gareth, Witten, Hastie & Tibshirani, Giới thiệu về Học thống kê , một cuốn sách về cơ bản là đơn giản hóa ESL + một số phòng thí nghiệm mã R rất tuyệt vời (ngoại trừ thực tế là họ sử dụng attach
, nhưng, hey, không ai hoàn hảo cả). Tôi sẽ liệt kê dưới đây những lý do ưu và nhược điểm của thuật ngữ này.
Trước hết, chúng ta phải nhớ rằng chúng tôi không chỉ giả có nghĩa là 0, mà còn để được độc lập của X (xem đoạn 2.6.1, công thức 2.29 của ESL, 2 nd edition, 12 ngày in ấn). Sau đó, tất nhiên ϵ không thể ước tính được từ X , bất kể lớp giả thuyết H (họ mô hình) nào chúng ta chọn, và mẫu chúng ta sử dụng lớn đến mức nào để tìm hiểu giả thuyết của chúng ta (ước tính mô hình của chúng ta). Điều này giải thích tại sao σ 2 ε được gọi là lỗi không thể rút gọn .εXεXHσ2ε
Bằng cách tương tự, có vẻ như tự nhiên để xác định phần còn lại của các lỗi, , các lỗi khử . Bây giờ, thuật ngữ này nghe có vẻ hơi khó hiểu: như một vấn đề thực tế, theo giả định chúng tôi đưa ra cho quá trình tạo dữ liệu, chúng tôi có thể chứng minh rằngƠ ( x0) - σ2ε
f( x ) = E [ Y| X= x ]
E [Y| X= x ] ∈ HE [Y| X= x ] ∉ Hf^( x ) trong gia đình người mẫu của chúng tôi.
HE [Y| X= x ]σ2εHϵ⊥X