Xác định trung bình thực từ các quan sát ồn ào


13

Tôi có một tập hợp lớn các điểm dữ liệu có dạng (trung bình, stdev). Tôi muốn giảm điều này thành một ý nghĩa duy nhất (tốt hơn) và độ lệch chuẩn nhỏ hơn (hy vọng).

Rõ ràng tôi có thể chỉ đơn giản là tính toán , tuy nhiên điều này không tính đến thực tế là một số điểm dữ liệu chính xác hơn đáng kể so với những điểm khác.datameanN

Nói một cách đơn giản, tôi muốn tạo ra mức trung bình có trọng số của các điểm dữ liệu này, nhưng không biết hàm trọng số phải là gì về độ lệch chuẩn.

Câu trả lời:


24

Bạn tìm kiếm một ước lượng tuyến tính cho giá trị trung bình của formμ

μ^=i=1nαixi

Trong đó là các trọng số và x i là các quan sát. Mục tiêu là tìm giá trị phù hợp cho các trọng số. Hãy σ iđúng độ lệch chuẩn của x i , mà có thể hoặc có thể không trùng với các ước tính độ lệch chuẩn bạn có thể có. Giả sử các quan sát là không thiên vị; đó là, kỳ vọng của họ đều bằng trung bình μ . Trong những điều kiện chúng ta có thể tính toán rằng sự mong đợi của μαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

và (với điều kiện không tương quan) phương sai của công cụ ước tính này làxi

Var[μ^]=i=1nαi2σi2.

Tại thời điểm này, nhiều người yêu cầu công cụ ước tính không thiên vị; đó là, chúng tôi muốn kỳ vọng của nó bằng với giá trị trung bình thực. Điều này ngụ ý các trọng số phải tổng hợp để thống nhất. Theo hạn chế này, độ chính xác của công cụ ước tính (được đo bằng sai số bình phương trung bình) được tối ưu hóa bằng cách giảm thiểu phương sai. Giải pháp duy nhất (dễ dàng thu được với một số nhân Lagrange hoặc bằng cách tái giải thích tình hình hình học là một vấn đề giảm thiểu khoảng cách) là trọng lượng phải tương xứng 1 / σ 2 i . αi1/σi2 Các giới hạn tổng hợp thống nhất ghim các giá trị của chúng, mang lại

μ^=i=1nxi/σi2i=1n1/σi2

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

Nói cách

1/n

σi


1
và liên quan đến câu trả lời này, cũng từ whuber: stats.stackexchange.com/questions/9071/NH
Henry

xi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.