Đây là một câu hỏi cũ nhưng câu trả lời được chấp nhận không thực sự chính xác hoặc đầy đủ. Người dùng muốn tính độ lệch chuẩn trên dữ liệu 12 tháng trong đó độ lệch trung bình và độ lệch chuẩn đã được tính qua mỗi tháng. Giả sử rằng số lượng mẫu trong mỗi tháng là như nhau, thì có thể tính trung bình và phương sai mẫu trong năm từ dữ liệu của mỗi tháng. Để đơn giản, giả sử rằng chúng ta có hai bộ dữ liệu:
X={x1,....xN}
Y={y1,....,yN}
μxμyσ2xσ2y
Bây giờ chúng tôi muốn tính toán các ước tính tương tự cho
Z={x1,....,xN,y1,...,yN}
μxσ2x
μx=∑Ni=1xiN
σ2x=∑Ni=1x2iN−μ2x
Để ước tính giá trị trung bình và phương sai trên tổng số chúng ta cần tính toán:
μz=∑Ni=1xi+∑Ni=1yi2N=(μx+μy)/2
σ2z=∑Ni=1x2i+∑Ni=1y2i2N−μ2z
σ2z=12(∑Ni=1x2iN−μ2x+∑Ni=1y2iN−μ2y)+12(μ2x+μ2y)−(μx+μy2)2
σ2z=12(σ2x+σ2y)+(μx−μy2)2
Vì vậy, nếu bạn có phương sai trên mỗi tập hợp con và bạn muốn phương sai trên toàn bộ thì bạn có thể tính trung bình phương sai của mỗi tập hợp con nếu tất cả chúng đều có cùng một giá trị. Mặt khác, bạn cần thêm phương sai trung bình của mỗi tập hợp con.
Giả sử trong nửa đầu năm chúng tôi sản xuất chính xác 1000 MWh mỗi ngày và trong nửa giây, chúng tôi sản xuất 2000 MWh mỗi ngày. Sau đó, giá trị trung bình và phương sai của sản xuất năng lượng trong nửa đầu và giây là 1000 và 2000 cho trung bình và phương sai là 0 cho cả hai nửa. Bây giờ có hai điều khác nhau mà chúng ta có thể quan tâm:
1- Chúng tôi muốn tính toán phương sai của sản xuất năng lượng trong cả năm : sau đó bằng cách tính trung bình hai phương sai chúng tôi đạt đến 0, điều này không đúng vì năng lượng mỗi ngày trong cả năm không phải là hằng số. Trong trường hợp này, chúng ta cần thêm phương sai của tất cả các phương tiện từ mỗi tập hợp con. Về mặt toán học trong trường hợp này, biến quan tâm ngẫu nhiên là sản xuất năng lượng mỗi ngày. Chúng tôi có số liệu thống kê mẫu trên các tập hợp con và chúng tôi muốn tính toán số liệu thống kê mẫu trong một thời gian dài hơn.
2- Chúng tôi muốn tính toán phương sai của sản xuất năng lượng mỗi năm: Nói cách khác, chúng tôi quan tâm đến việc sản xuất năng lượng thay đổi từ năm này sang năm khác. Trong trường hợp này, trung bình phương sai dẫn đến câu trả lời đúng là 0, vì mỗi năm chúng tôi sản xuất trung bình 1500 MHW. Về mặt toán học trong trường hợp này, biến quan tâm ngẫu nhiên là trung bình của sản xuất năng lượng mỗi ngày trong đó việc tính trung bình được thực hiện trong cả năm.