Các công thức bạn đang sử dụng từ lâu đã được biết là không ổn định về số lượng. Nếu phương tiện bình phương lớn so với phương sai và / hoặc phương tiện sản phẩm lớn so với hiệp phương sai, thì sự khác biệt về tử số và trong các thuật ngữ được đặt trong ngoặc số có thể có vấn đề với việc hủy bỏ thảm khốc .
Điều này đôi khi có thể dẫn đến các phương sai hoặc hiệp phương sai được tính toán thậm chí không giữ được một chữ số chính xác (nghĩa là tệ hơn vô dụng).
Đừng sử dụng những công thức này. Chúng có ý nghĩa khi mọi người tính toán bằng tay , nơi bạn có thể nhìn thấy và xử lý sự mất độ chính xác như vậy khi nó xảy ra - ví dụ: việc sử dụng các công thức này thường được đi trước bằng cách loại bỏ các chữ số phổ biến, vì vậy các số như thế này:
8901234.567...
8901234.575...
8901234.412...
đầu tiên sẽ có 8901234 bị trừ (ít nhất) - sẽ tiết kiệm rất nhiều thời gian trong công việc cũng như tránh vấn đề hủy bỏ. Phương tiện (và số lượng tương tự) sau đó sẽ được điều chỉnh trở lại vào cuối, trong khi phương sai và hiệp phương sai có thể được sử dụng như hiện trạng.
Những ý tưởng tương tự (và những ý tưởng khác) có thể được sử dụng với máy tính, nhưng thực sự bạn cần sử dụng chúng mọi lúc, thay vì cố gắng đoán khi nào bạn có thể cần chúng.
Các cách hiệu quả để giải quyết vấn đề này đã được biết đến trong hơn nửa thế kỷ - ví dụ, xem bài báo năm 1962 của Welford [1] (trong đó ông đưa ra các thuật toán phương sai và hiệp phương sai một lần - các thuật toán hai lần ổn định đã được biết rõ). Chan và cộng sự [2] (1983) so sánh một số thuật toán phương sai và đưa ra cách quyết định khi nào nên sử dụng (mặc dù trong hầu hết các triển khai thường mọi người chỉ sử dụng một thuật toán).
Xem thảo luận của Wikipedia về vấn đề này liên quan đến phương sai và thảo luận về các thuật toán phương sai .
Nhận xét tương tự áp dụng cho hiệp phương sai.
[1] BP Welford (1962),
"Lưu ý về phương pháp tính tổng bình phương và sản phẩm chính xác",
Technometrics Vol. 4, Vấn đề. 3, 419-420
( liên kết citeseer )
[2] TF Chan, GH Golub và RJ LeVeque (1983)
"Thuật toán tính toán phương sai mẫu: Phân tích và khuyến nghị",
Thống kê người Mỹ , Tập. 37, Số 3 (Aug.1983), trang 242-247
Phiên bản báo cáo công nghệ