Xu hướng lạc quan - ước tính lỗi dự đoán


9

Cuốn sách Các yếu tố của học thống kê (có sẵn trong PDF trực tuyến) thảo luận về xu hướng tối ưu (7.21, trang 229). Nó nói rằng độ lệch lạc quan là sự khác biệt giữa lỗi huấn luyện và lỗi trong mẫu (lỗi được quan sát nếu chúng ta lấy mẫu các giá trị kết quả mới tại mỗi điểm đào tạo ban đầu) (theo bên dưới).

nhập mô tả hình ảnh ở đây

Tiếp theo, nó tuyên bố độ lệch lạc quan ( ) này bằng với hiệp phương sai của các giá trị y ước tính của chúng tôi và các giá trị y thực tế (công thức theo bên dưới). Tôi gặp khó khăn trong việc hiểu tại sao công thức này chỉ ra sự thiên vị lạc quan; ngây thơ tôi đã nghĩ rằng một hiệp phương sai mạnh mẽ giữa thực tế và dự đoán chỉ mô tả sự chính xác - không phải sự lạc quan. Hãy cho tôi biết nếu ai đó có thể giúp đỡ với công thức phái sinh hoặc chia sẻ trực giác. ωyy

nhập mô tả hình ảnh ở đây


Rất hữu ích, cảm ơn bạn! Tôi nghĩ rằng một trong các phương trình có một lỗi đánh máy nhỏ và nên:=1Ni=1N(Ey[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])
Ngủ

Câu trả lời:


8

Hãy bắt đầu với trực giác.

Không có gì sai khi sử dụng để dự đoán . Trong thực tế, không sử dụng nó có nghĩa là chúng ta đang vứt bỏ thông tin có giá trị. Tuy nhiên, chúng tôi càng phụ thuộc vào thông tin có trong để đưa ra dự đoán của mình, người ước tính của chúng tôi sẽ càng lạc quan quá mức .yiy^iyi

Ở một thái cực, nếu chỉ là , bạn sẽ hoàn hảo trong dự đoán mẫu ( ), nhưng chúng tôi khá chắc chắn rằng dự đoán ngoài mẫu sẽ không tốt. Trong trường hợp này (thật dễ dàng để tự kiểm tra), mức độ tự do sẽ là .y^iyiR2=1df(y^)=n

Ở một thái cực khác, nếu bạn sử dụng giá trị trung bình mẫu của : cho tất cả , thì mức độ tự do của bạn sẽ chỉ là 1.yyi=yi^=y¯i

Kiểm tra bản tin hay này của Ryan Tibshirani để biết thêm chi tiết về trực giác này


Bây giờ là một bằng chứng tương tự với câu trả lời khác, nhưng với một chút giải thích

Hãy nhớ rằng, theo định nghĩa, sự lạc quan trung bình là:

ω=Ey(Errinerr¯)

=Ey(1Ni=1NEY0[L(Yi0,f^(xi)|T)]1Ni=1NL(yi,f^(xi)))

Bây giờ sử dụng hàm mất bậc hai và mở rộng các số hạng bình phương:

=Ey(1Ni=1NEY0[(Yi0y^i)2]1Ni=1N(yiy^i)2))

=1Ni=1N(EyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

sử dụng để thay thế:EyEY0[(Yi0)2]=Ey[yi2]

=1Ni=1N(Ey[yi2]+Ey[yi^2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2E[yiy^i])

=2Ni=1N(E[yiy^i]Ey[yi]Ey[y^i])

Để kết thúc, lưu ý rằng , mang lại:Cov(x,w)=E[xw]E[x]E[w]

=2Ni=1NCov(yi,y^i)

5
Tôi phải chỉ ra rằng tên của anh ấy được đánh vần là "Ryan Tibshirani" Rob
Tibshirani

2
Chào mừng bạn đến với trang web của chúng tôi, Rob - thật vinh dự khi có bạn ở đây, nếu chỉ để sửa lỗi! Nếu bạn thấy thêm nữa, xin vui lòng cho chúng tôi biết: và tất nhiên chúng tôi sẽ rất vui vì bất kỳ câu trả lời nào mà bạn (hoặc học sinh của bạn) có thể quan tâm để đăng. Công việc của bạn được tham khảo rộng rãi trên trang web này, đặc biệt là ESLGiới thiệu về Bootstrap.
whuber

Tâm giải thích ? Ngoài ra, là ? EyEY0[(Yi0)2]=Ey[yi2]2EyEY0[Yi0y^i]=2Ey[EY0[Yi0]EY0[y^i]]=2Ey[yi]Ey[y^i]
Shookie

7

Đặt , sau đó f^(xi)=y^i

ω=Ey[op]=Ey[Errinerr¯]=Ey[Errin]Ey[err¯]=Ey[1Ni=1NEY0[L(Yi0,f^(xi))]Ey[1Ni=1NL(yi,f^(xi))]=1Ni=1NEyEY0[(Yi0y^i)2]Ey[(yiy^i)2]=1Ni=1NEyEY0[(Yi0)2]+EyEY0[y^i2]2EyEY0[Yi0y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=1Ni=1NEy[yi2]+Ey[y^i2]2Ey[yi]Ey[y^i]Ey[yi2]Ey[y^i2]+2Ey[yiy^i]=2Ni=1NEy[yiy^i]Ey[yi]Ey[y^i]=2Ni=1NEy[yiy^iyiEy[y^i]Ey[yi]y^i+Ey[yi]Ey[y^i]]=2Ni=1NEy[(y^iEy[y^i])([yiEy[yi])]=2Ni=1Ncov(y^i,yi)
QED

1
Bốn bước cuối cùng có thể được đơn giản hóa bằng tính chất hiệp phương sai này:E[xw]E[x]E[w]=Cov(x,w)
cd98
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.