Sự cố xảy ra khi một mô hình có xu hướng phù hợp với tiếng ồn cao.f(x,θ)
Trong trường hợp đó mô hình có xu hướng phù hợp quá mức. Đó là, nó không chỉ thể hiện mô hình thực mà còn là nhiễu ngẫu nhiên mà bạn không muốn chụp với mô hình của mình (vì nhiễu là một phần không có hệ thống không cho phép bạn đưa ra dự đoán cho dữ liệu mới).
Người ta có thể cải thiện (giảm) tổng sai số của khớp, bằng cách đưa ra một số sai lệch, khi sai lệch này làm cho phương sai / khớp quá giảm giảm mạnh hơn so với tăng sai lệch / không khớp (nghĩa là không thể hiện chính xác mô hình thực) .
1. Tại sao chính xác và không thể giảm đồng thời?E[(θ^n−E[θ^n])2]E[θ^n−θ]
Đây không phải là sự thật. Chúng có thể được giảm đồng thời (tùy trường hợp). Hãy tưởng tượng rằng bạn đã giới thiệu một số sai lệch, cả hai đều làm tăng phương sai cũng như sai lệch. Sau đó theo hướng ngược lại giảm sự thiên vị này sẽ đồng thời giảm sự thiên vị và phương sai.
Ví dụ: một bình phương gốc có tỷ lệ chênh lệch bình phương cho mẫu có kích thước là một ước lượng không thiên vị cho độ lệch chuẩn dân số khi . Bây giờ, nếu bạn có , thì cả hai bạn sẽ giảm độ lệch cũng như phương sai khi bạn giảm kích thước của hằng số này .c1n∑(xi−x¯)2−−−−−−−−−−−√nσc=nn−1−−−√c>nn−1−−−√c
Tuy nhiên, sự thiên vị (cố ý) được thêm vào trong chính quy hóa thường là loại làm giảm phương sai (ví dụ: bạn có thể giảm xuống mức dưới ). Do đó, bạn có được sự đánh đổi trong thiên vị so với phương sai và loại bỏ sự thiên vị sẽ (trong thực tế) làm tăng phương sai.cnn−1−−−√
2. Tại sao chúng ta không thể lấy một số ước lượng không thiên vị và giảm phương sai bằng cách tăng cỡ mẫu?
Về nguyên tắc bạn có thể.
Nhưng,
- Điều này có thể đòi hỏi nhiều nỗ lực lấy mẫu hơn, tốn kém và điều này thường là một hạn chế.
Có thể cũng có thể có những khó khăn về tính toán với các vấn đề ước tính nhất định và kích thước mẫu sẽ cần phải tăng cực kỳ để giải quyết vấn đề này, nếu có thể.
(ví dụ: các tham số chiều cao> các phép đo hoặc như trong hồi quy sườn núi : các đường rất nông quanh mức tối ưu toàn cầu)
Thường cũng không có sự phản đối để thiên vị. Khi nói về việc giảm tổng lỗi (như trong nhiều trường hợp) thì việc sử dụng công cụ ước tính sai lệch nhưng ít sai sót hơn sẽ được ưu tiên.
Về ví dụ truy cập của bạn.
Liên quan đến câu hỏi thứ hai của bạn, bạn thực sự có thể giảm lỗi bằng cách tăng kích thước mẫu. Và liên quan đến câu hỏi đầu tiên của bạn, bạn cũng có thể giảm cả sai lệch và phương sai (giả sử bạn sử dụng một mẫu có tỷ lệ trung bình làm công cụ ước tính của dân số và xem xét thay đổi tham số tỷ lệ ).c∑xinc
Tuy nhiên, khu vực quan tâm thực tế là nơi độ lệch giảm trùng khớp với phương sai tăng. Hình ảnh bên dưới cho thấy độ tương phản này bằng cách sử dụng một mẫu (size = 5) được lấy từ phân phối bình thường với phương sai = 1 và mean = 1. Giá trị trung bình của mẫu không được tính là giá trị dự đoán không thiên vị của trung bình dân số. Nếu bạn sẽ tăng tỷ lệ của công cụ dự đoán này thì bạn có cả độ lệch và tăng phương sai. Tuy nhiên, nếu bạn giảm tỷ lệ của công cụ dự đoán thì bạn có độ lệch tăng, nhưng giảm phương sai. Công cụ dự đoán "tối ưu" sau đó thực sự không phải là trung bình mẫu mà là một số công cụ ước tính bị thu hẹp (xem thêm Tại sao công cụ ước tính James-Stein được gọi là công cụ ước tính "co ngót"? ).