Hãy bắt đầu với trực giác.
Không có gì sai khi sử dụng để dự đoán . Trong thực tế, không sử dụng nó có nghĩa là chúng ta đang vứt bỏ thông tin có giá trị. Tuy nhiên, chúng tôi càng phụ thuộc vào thông tin có trong để đưa ra dự đoán của mình, người ước tính của chúng tôi sẽ càng lạc quan quá mức .yiy^iyi
Ở một thái cực, nếu chỉ là , bạn sẽ hoàn hảo trong dự đoán mẫu ( ), nhưng chúng tôi khá chắc chắn rằng dự đoán ngoài mẫu sẽ không tốt. Trong trường hợp này (thật dễ dàng để tự kiểm tra), mức độ tự do sẽ là .y^iyiR2=1df(y^)=n
Ở một thái cực khác, nếu bạn sử dụng giá trị trung bình mẫu của : cho tất cả , thì mức độ tự do của bạn sẽ chỉ là 1.yyi=yi^=y¯i
Kiểm tra bản tin hay này của Ryan Tibshirani để biết thêm chi tiết về trực giác này
Bây giờ là một bằng chứng tương tự với câu trả lời khác, nhưng với một chút giải thích
Hãy nhớ rằng, theo định nghĩa, sự lạc quan trung bình là:
ω=Ey(Errin−err¯¯¯¯¯¯¯)
=Ey(1N∑i=1NEY0[L(Y0i,f^(xi)|T)]−1N∑i=1NL(yi,f^(xi)))
Bây giờ sử dụng hàm mất bậc hai và mở rộng các số hạng bình phương:
=Ey(1N∑i=1NEY0[(Y0i−y^i)2]−1N∑i=1N(yi−y^i)2))
=1N∑i=1N(EyEY0[(Y0i)2]+EyEY0[y^2i]−2EyEY0[Y0iy^i]−Ey[y2i]−Ey[y^2i]+2E[yiy^i])
sử dụng để thay thế:EyEY0[(Y0i)2]=Ey[y2i]
=1N∑i=1N(Ey[y2i]+Ey[yi^2]−2Ey[yi]Ey[y^i]−Ey[y2i]−Ey[y^2i]+2E[yiy^i])
=2N∑i=1N(E[yiy^i]−Ey[yi]Ey[y^i])
Để kết thúc, lưu ý rằng , mang lại:Cov(x,w)=E[xw]−E[x]E[w]
=2N∑i=1NCov(yi,y^i)