Minh họa Bias - Variance Tradeoff bằng ví dụ về đồ chơi
Như @Matthew Drury chỉ ra, trong các tình huống thực tế, bạn không được xem biểu đồ cuối cùng, nhưng ví dụ đồ chơi sau đây có thể cung cấp giải thích trực quan và trực giác cho những người thấy nó hữu ích.
Bộ dữ liệu và giả định
Y
- Y= s i n ( πx - 0,5 ) + εϵ ∼ Un i fo r m ( - 0,5 , 0,5 )
- Y= f( X ) + ε
xYVmột r ( Y) = Va r ( ϵ ) = 112
f^( X ) = β0+ β1x + β1x2+ . . . + βpxp
Lắp các mô hình đa thức khác nhau
Theo trực giác, bạn sẽ mong đợi một đường cong thẳng thực hiện kém vì bộ dữ liệu rõ ràng là không tuyến tính. Tương tự, phù hợp với một đa thức bậc rất cao có thể là quá mức. Trực giác này được phản ánh trong biểu đồ bên dưới hiển thị các mô hình khác nhau và Lỗi bình phương trung bình tương ứng của chúng cho dữ liệu thử nghiệm và huấn luyện.
Biểu đồ trên hoạt động cho một phân tách thử nghiệm / đào tạo duy nhất nhưng làm thế nào để chúng ta biết liệu nó có khái quát không?
Ước tính chuyến tàu dự kiến và kiểm tra MSE
Ở đây chúng tôi có nhiều tùy chọn, nhưng một cách tiếp cận là phân chia dữ liệu ngẫu nhiên giữa tàu / kiểm tra - phù hợp với mô hình trên phần tách đã cho và lặp lại thí nghiệm này nhiều lần. MSE kết quả có thể được vẽ và trung bình là ước tính của lỗi dự kiến.
Thật thú vị khi thấy rằng MSE thử nghiệm dao động dữ dội cho các phân chia dữ liệu / thử nghiệm khác nhau của dữ liệu. Nhưng lấy trung bình trên một số lượng thí nghiệm đủ lớn giúp chúng tôi tự tin hơn.
Y
Xu hướng - Phân tích phương sai
Như đã giải thích ở đây , MSE có thể được chia thành 3 thành phần chính:
E[ ( Y- f^)2] = σ2ε+ B i a s2[ f^] + Vmột r [ f^]
E[ ( Y- f^)2] = σ2ε+ [ f- E[ f^] ]2+ E[ f^- E[ f^] ]2
Trường hợp trong trường hợp đồ chơi của chúng tôi:
- f được biết đến từ bộ dữ liệu ban đầu
- σ2ε được biết đến từ sự phân phối đồng đều của ε
- E[ f^] có thể được tính như trên
- f^ tương ứng với một đường màu sáng
- E[ f^- E[ f^] ]2 có thể được ước tính bằng cách lấy trung bình
Đưa ra mối quan hệ sau đây
Lưu ý: biểu đồ trên sử dụng dữ liệu huấn luyện để phù hợp với mô hình và sau đó tính toán MSE trên tàu + kiểm tra .