Có hai định nghĩa về từ thiên vị?


7

Tôi nghe thấy thuật ngữ thiên vị được ném xung quanh rất nhiều trong tài liệu thống kê.

Ví dụ,

Bằng cách sử dụng phương pháp cắt cụt trung bình, chúng tôi đang thêm độ lệch cho ước tính của chúng tôi.

Một vi dụ khac,

Sự đánh đổi sai lệch thiên vị là một chủ đề quan trọng khi chọn mô hình.

Đây có phải là cùng một "thiên vị"?


1
Thực tế có 12 định nghĩa: dictionary.com/browse/bias?s=t
StatsStudent 18/03/2016

1
@StatsStudent đó không phải là định nghĩa về ý nghĩa thống kê
Tim

Nhưng khi bạn nghe "thiên vị", ngay cả trong tài liệu thống kê, nó không nhất thiết phải có ý nghĩa thống kê ...
StatsStudent

Câu trả lời:


3

Thuật ngữ "thiên vị" có một định nghĩa cụ thể trong tài liệu thống kê (sự khác biệt giữa giá trị dự kiến ​​của một công cụ ước tính và điều được ước tính), nhưng điều đó không có nghĩa là nó mất đi ý nghĩa chung, nguyên gốc hơn. Cái nào được dự định sẽ phụ thuộc vào ngữ cảnh và đôi khi bạn sẽ có một hỗn hợp của cả hai.

Tôi muốn nói rằng việc sử dụng đầu tiên nói chung là loại ít chính xác hơn, vì việc cắt bỏ dữ liệu là một phương pháp được sử dụng trong các vấn đề được áp dụng trong đó người ta không cần phải giả sử rằng bất kỳ giá trị thực nào của tham số thậm chí còn tồn tại. Về cơ bản, nó đồng nghĩa với "thu nhỏ về không."

Theo như cách sử dụng thứ hai liên quan đến thuật ngữ đánh đổi sai lệch thiên vị ban đầu xuất phát từ định nghĩa chính thức hơn về thiên vị, nhưng dù sao tôi vẫn nói điều này đề cập nhiều hơn đến "tính không linh hoạt" của quy trình điều chỉnh mô hình, chứ không phải nhất thiết phải là câu hỏi về việc có hay không một hàm hồi quy ước tính là chính xác.


Hừm - đối với người đầu tiên: toàn bộ quan điểm của việc cắt bỏ trung bình là duy trì giá trị trung bình của mẫu ban đầu. Do đó cả hai tham số phải giống nhau - vì vậy nó không có sai lệch. \

Tôi khá chắc chắn rằng họ đang nói về độ lệch của ước tính hệ số chứ không phải độ lệch của mẫu trung bình. Ngoài ra, không có nghĩa là mẫu không thiên vị khi bạn thiếu dữ liệu.
DSaxton 18/03/2016

2

Tôi đồng ý rằng thuật ngữ này là khó hiểu. Xu hướng có một ý nghĩa trong cả hai bối cảnh này: khoảng cách từ các giá trị lý tưởng hoặc mục tiêu, nhưng việc giải thích phụ thuộc vào không gian mà chúng ta đang nói đến. Tôi sẽ giải thích những gì tôi muốn nói về hai trích dẫn trong câu hỏi của bạn.

Bằng cách sử dụng phương pháp cắt cụt trung bình, chúng tôi đang thêm độ lệch cho ước tính của chúng tôi.

Điều này đề cập đến sự thiên vị trong không gian dữ liệu. Việc cắt bỏ có ý nghĩa có ảnh hưởng đến vị trí của các ước tính của bạn so với các giá trị đích.

Sự đánh đổi sai lệch thiên vị là một chủ đề quan trọng khi chọn mô hình.

Điều này đề cập đến sai lệch và phương sai trong không gian tham số của các mô hình. Đó là, nếu bạn đã đào tạo một mô hình ngẫu nhiên 1000 lần, bạn có thể quan sát sai lệch hoặc phương sai của các giá trị tham số. Một mô hình thiên vị cao có các tham số nhất quán, nhưng chúng khác với giải pháp 'tối ưu'. Một mô hình phương sai cao sẽ nhận được các giá trị khác nhau cho các tham số mỗi khi nó được đào tạo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.