Điều chỉnh sai lệch trong phương sai trọng số


22

Đối với phương sai không trọng số

Var(X):=1ni(xiμ)2
tồn tại phương sai mẫu đã hiệu chỉnh sai lệch, khi giá trị trung bình được ước tính từ cùng một dữ liệu:
Var(X):=1n1i(xiE[X])2

Tôi đang xem xét trung bình và phương sai có trọng số, và tự hỏi điều chỉnh sai lệch thích hợp cho phương sai trọng số là gì. Sử dụng:

mean(X):=1iωiiωixi

Phương sai "ngây thơ", không được sửa mà tôi đang sử dụng là:

Var(X):=1iωiiωi(ximean(X))2

Vì vậy, tôi tự hỏi liệu cách chính xác để sửa sai lệch là

A)

Var(X):=1iωi1iωi(ximean(X))2

hoặc B)

Var(X):=nn11iωiiωi(ximean(X))2

hoặc C)

Var(X):=iωi(iωi)2iωi2iωi(ximean(X))2

A) không có ý nghĩa với tôi khi trọng lượng nhỏ. Giá trị chuẩn hóa có thể là 0 hoặc thậm chí âm. Nhưng làm thế nào về B) ( là số lượng quan sát) - đây có phải là cách tiếp cận đúng? Bạn có một số tài liệu tham khảo cho thấy điều này? Tôi tin rằng "Cập nhật ước tính trung bình và phương sai: một phương pháp cải tiến", DHD West, 1979 sử dụng phương pháp này. Thứ ba, C) là cách giải thích của tôi về câu trả lời cho câu hỏi này: /mathpro/22203/unbiased-estimate-of-the-variance-of-an-unn normalised-weighted-meann

Đối với C) Tôi vừa nhận ra rằng mẫu số trông rất giống . Có một số kết nối chung ở đây? Tôi nghĩ rằng nó không hoàn toàn phù hợp; và rõ ràng có mối liên hệ mà chúng ta đang cố gắng tính toán phương sai ...Var(Ω)

Cả ba người trong số họ dường như "sống sót" khi kiểm tra độ tỉnh táo của việc đặt tất cả . Vậy tôi nên sử dụng cái nào, dưới cơ sở nào? '' Cập nhật: '' whuber gợi ý cũng để làm việc kiểm tra sự tỉnh táo với ω 1 = ω 2 = 0,5 và tất cả còn lại ω i = ε nhỏ. Điều này dường như loại trừ A và B.ωi=1ω1=ω2=.5ωi=ϵ


n=2

@whuber ThePawn dưới đây gợi ý rằng đó là C. Bạn có quan tâm chi tiết hơn không?
Anony-Mousse

1
Giải pháp (A) hoạt động, tôi đã thực hiện nó trong quá khứ và có thể xác nhận từ các thử nghiệm thực nghiệm rằng nó cho kết quả chính xác. Tuy nhiên, bạn chỉ phải sử dụng các giá trị nguyên cho các trọng số và> 0.
gabious

Cảm ơn! Điều này giúp tôi rất nhiều để đi đúng hướng khi các trọng số dành cho trung bình di chuyển theo cấp số nhân! Nó chỉ ra rằng cách ngây thơ để tính toán phương sai thực sự đánh giá quá cao nó theo hệ số không đổi là 2, ngoài hiệu chỉnh nhỏ (1-1 / n) hiển thị tương tự với phép tính trung bình di chuyển đơn giản. Đó là một trường hợp đặc biệt điên rồ!
saolof

Câu trả lời:


10

Tôi đã trải qua môn toán và kết thúc với biến thể C:

Var(X)=(iωi)2(iωi)2iωi2V¯
V¯ωi

λi=ωiiωi

V¯=iλi(xijλjxj)2

(xijλjxj)2=xi2+j,kλjλkxjxk2jλjxixj

E[xixj]=Var(X)1i=j+E[X]2E[X]

E[V¯]=Var(X)iλi(1+jλj22λi)
E[V¯]=Var(X)(1jλj2)
λiωi để có được biến thể C.

Đó là biến thể C ở trên, phải không?
Anony-Mousse

Oups, vâng, nó là biến thể C.
ThePawn

Tôi đã kiểm tra giải pháp này theo kinh nghiệm và nó KHÔNG hoạt động ... Cách duy nhất là giải pháp (A) mà tôi cũng đã tự mình thực hiện trong quá khứ, nhưng nó chỉ hoạt động với trọng số là số nguyên và> = 0
gabious

2
Phương trình này sai theo Wikipedia, Matlab, R và những người khác đang thực hiện phương trình này. Tử số ở đây là bình phương, nhưng KHÔNG nên, nó giống như (C) do OP đề xuất. Xem en.wikipedia.org/wiki/ Từ
gabious

1
@rajatkhanduja Tôi không nói về bằng chứng mà là phương trình dẫn xuất cuối cùng (phương trình đứng đầu trong câu trả lời này). Nhưng thực sự là chính xác, tử số chỉ bình phương vì chúng ta nhân với V, do đó tử số cuối cùng không được đáp ứng. Dù sao, công cụ ước tính này vẫn thiên vị khi tôi giải thích trong câu trả lời của mình dưới đây vì nó phụ thuộc vào trọng số "độ tin cậy".
gabious

7

Cả A và C đều đúng, nhưng bạn sẽ sử dụng loại nào tùy thuộc vào loại trọng lượng bạn sử dụng:

  • A cần bạn sử dụng trọng số "lặp lại" (số nguyên đếm số lần xuất hiện cho mỗi lần quan sát) và không thiên vị .
  • C cần bạn sử dụng trọng số "độ tin cậy" (trọng số chuẩn hóa hoặc phương sai cho mỗi quan sát) và bị sai lệch . Nó không thể thiên vị.

Lý do tại sao C nhất thiết là sai lệch là vì nếu bạn không sử dụng trọng số "lặp lại", bạn sẽ mất khả năng đếm tổng số quan sát (cỡ mẫu) và do đó bạn không thể sử dụng hệ số hiệu chỉnh.

Để biết thêm thông tin, hãy kiểm tra bài viết Wikipedia đã được cập nhật gần đây: http://en.wikipedia.org/wiki/ WEighted_arithatures_mean# WEighted_sample_variance

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.