Điều chỉnh sai lệch là gì? [đóng cửa]


12

Tôi đã thấy nhiều nơi họ có bộ dữ liệu đầu vào / đầu ra nơi đầu tiên họ tạo một đường hồi quy tuyến tính, sửa lỗi sai lệch và sau đó chỉ sử dụng dữ liệu đó cho mô hình của họ. Tôi đã không nhận được sự điều chỉnh sai lệch này là gì?


6
Tôi nghĩ rằng bạn có thể cần cung cấp một tài liệu tham khảo hoặc một ví dụ rõ ràng để chúng tôi có thể biết chính xác những gì bạn đang phản ứng.
whuber

@ naught101, vui lòng thực hiện một vài lần, đừng spam trang chính.
gung - Phục hồi Monica

@gung: ah .. ý bạn là tag vài cái rồi đợi một chút? Xin lỗi, quá muộn. Tôi chỉ tìm thấy 10 hoặc hơn, và tôi đã làm tất cả. Quên về hiệu ứng trang trước: / Nếu chỉ SE có một tính năng gắn thẻ hàng loạt đẹp.
ness101

@gung: Có lẽ hôm nay có thể là ngày điều chỉnh thiên vị khai mạc: D
naught101

1
@ naught101 retagging hàng loạt đơn phương là một chút không, đặc biệt là trên một thẻ bạn vừa thực hiện. Nói chung, tốt nhất là tham gia vào meta khi khả thi (để giải thích những gì bạn dự định) và nếu điều đó có vẻ không gây tranh cãi, thì hãy thực hiện một số thử lại nhưng chỉ một vài lần.
Glen_b -Reinstate Monica

Câu trả lời:


11

Mặc dù tuyên bố vấn đề không đủ chính xác để biết chính xác loại chỉnh sửa thiên vị mà bạn đang đề cập đến, tôi nghĩ rằng tôi có thể nói về nó trong thuật ngữ chung. Đôi khi một người ước tính có thể bị sai lệch. Điều này chỉ có nghĩa là mặc dù nó có thể là một công cụ ước tính tốt, giá trị trung bình hoặc dự kiến ​​của nó không chính xác bằng tham số. Sự khác biệt giữa giá trị trung bình của công cụ ước tính và giá trị tham số thực được gọi là độ lệch. Khi một công cụ ước tính được biết là sai lệch, đôi khi, bằng cách khác, có thể ước tính độ lệch và sau đó sửa đổi công cụ ước tính bằng cách trừ đi độ lệch ước tính từ ước tính ban đầu. Thủ tục này được gọi là hiệu chỉnh sai lệch. Nó được thực hiện với mục đích cải thiện dự toán. Trong khi nó sẽ làm giảm sự thiên vị, nó cũng sẽ làm tăng phương sai.

Một ví dụ điển hình về hiệu chỉnh sai lệch thành công là ước tính hiệu chỉnh sai lệch bootstrap của tỷ lệ lỗi phân loại. Ước tính tái lập tỷ lệ lỗi có độ lệch lạc quan lớn khi cỡ mẫu nhỏ. Bootstrap được sử dụng để ước tính độ lệch của ước tính tái cấu trúc và vì ước tính tái cấu trúc đánh giá thấp tỷ lệ lỗi, ước tính sai lệch được thêm vào ước tính tái định vị để lấy ước tính sai lệch bootstrap của tỷ lệ lỗi. Khi cỡ mẫu nhỏ hơn 30 hoặc ít hơn kết hợp cả hai lớp trong một vấn đề hai lớp, một số dạng ước tính bootstrap nhất định (đặc biệt là ước tính 632) cung cấp các ước tính chính xác hơn về tỷ lệ lỗi so với xác thực chéo một lần (rất giống nhau ước tính gần như không thiên vị về tỷ lệ lỗi).


1
"Trong khi nó sẽ làm giảm sự thiên vị, nó cũng sẽ làm tăng phương sai." - bạn có thể giải thích thêm một chút không? Nó không phụ thuộc vào phương pháp? Về cơ bản, bạn có nghĩa là việc giảm độ lệch của hồi quy tuyến tính tối ưu RMSE sẽ nhất thiết phải tăng RMSE, hay nó là một cái gì khác?
ness101
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.