Câu hỏi được liên kết của bạn là giải quyết việc sử dụng trọng số như một lối tắt để xử lý trọng số bằng nhau cho mỗi phương sai điểm dữ liệu trong đó một số điểm dữ liệu xảy ra nhiều lần.
@whuber đã giải quyết trong một bình luận về tình huống trong đó phương sai của tất cả các điểm dữ liệu là bằng nhau. Vì vậy, tôi sẽ giải quyết tình huống mà họ không bằng nhau. Trong tình huống này, giá trị trung bình có trọng số tối ưu tạo ra phương sai thấp hơn giá trị trung bình không có trọng số, nghĩa là có trọng số tương đương.
Giá trị trung bình có trọng số, sử dụng trọng số , bằng và có phương sai = . Vì vậy, chúng tôi muốn giảm thiểu , tuân theo và cho tất cả i.wiΣni=1wixiΣni=1w2iVar(xi)Σni=1w2iVar(xi)Σni=1wi=1wi≥0
Các điều kiện Karush-Kuhn-Tucker, cần thiết và đủ cho mức tối thiểu toàn cầu cho vấn đề này, do đó là một vấn đề Lập trình bậc hai lồi, dẫn đến một giải pháp dạng đóng, cụ thể là:
ưu cho 1 = 1 .. n.wi=[1/Var(xi)]/Σnj=1[1/Var(xj)]
Phương sai của giá trị trung bình tối ưu tương ứng = .1/Σni=1[1/Var(xi)]
Ngược lại, trọng số bằng nhau có nghĩa là cho tất cả i, trong đó n là số điểm dữ liệu. Như được chỉ ra bởi whuber, các trọng số bằng nhau là tối ưu nếu tất cả các phương sai điểm dữ liệu đều bằng nhau, có thể được nhìn thấy từ công thức trên cho tối ưu . Tuy nhiên, theo công thức đó, trọng số bằng nhau không tối ưu nếu phương sai điểm dữ liệu không bằng nhau và thực sự dẫn đến phương sai lớn hơn (trung bình có trọng số) so với trọng số tối ưu. Phương sai của giá trị trung bình có trọng số bằng nhau, nghĩa là phương sai của trung bình có trọng số sử dụng trọng số bằng nhau = .wi=1nwi1n2Σni=1Var(xi)
Dưới đây là một số ví dụ kết quả số:
- Có hai điểm dữ liệu, có phương sai tương ứng là 1 và 4. Giá trị trung bình không có trọng số có phương sai = 1,25. Giá trị trung bình có trọng số sử dụng các trọng số tối ưu tương ứng là 0,8 và 0,2, có phương sai = 0,8, tất nhiên là nhỏ hơn 1,25.
- Có ba điểm dữ liệu, có phương sai tương ứng là 1, 4 và 9. Giá trị trung bình không có trọng số có phương sai = 1.5556. Giá trị trung bình có trọng số sử dụng các trọng số tối ưu tương ứng là 0,7347, 0,1837, 0,0816, có phương sai = 0,7347, tất nhiên là nhỏ hơn 1,55556.
Tất nhiên, có nghĩa là trung bình có trọng số có phương sai lớn hơn trung bình không trọng số, nếu các trọng số được chọn theo cách kém. Bằng cách chọn trọng số 1 trên điểm dữ liệu có phương sai lớn nhất và 0 cho tất cả các điểm dữ liệu khác, giá trị trung bình có trọng số sẽ có phương sai = phương sai lớn nhất của bất kỳ điểm dữ liệu nào. Ví dụ cực đoan này sẽ là kết quả của việc tối đa hóa thay vì giảm thiểu trong vấn đề tối ưu hóa mà tôi đặt ra.