Giá trị trung bình giảm thiểu sai số bình phương (hoặc định mức L2, xem tại đây hoặc tại đây ), vì vậy lựa chọn tự nhiên cho phương sai để đo khoảng cách từ giá trị trung bình là sử dụng lỗi bình phương (xem tại đây tại sao chúng ta bình phương nó). Mặt khác, trung vị giảm thiểu sai số tuyệt đối (chỉ tiêu L1), nghĩa là đó là một giá trị nằm ở "giữa" dữ liệu của bạn, do đó khoảng cách tuyệt đối với trung vị (được gọi là Độ lệch tuyệt đối trung bình hoặc MAD) dường như là một đo lường tốt hơn về mức độ thay đổi xung quanh trung vị. Bạn có thể đọc thêm về mối quan hệ này trong chủ đề này .
Nói ngắn gọn, phương sai khác với MAD về cách họ xác định điểm trung tâm của dữ liệu của bạn và điều này ảnh hưởng đến cách chúng tôi đo lường sự biến đổi của các điểm dữ liệu xung quanh nó. Bình phương các giá trị làm cho các ngoại lệ có ảnh hưởng lớn hơn đến điểm trung tâm (trung bình), trong khi trong trường hợp trung vị, tất cả các điểm có cùng tác động đến nó, vì vậy khoảng cách tuyệt đối có vẻ phù hợp hơn.
Điều này cũng có thể được hiển thị bằng mô phỏng đơn giản. Nếu bạn so sánh các giá trị bình phương khoảng cách từ giá trị trung bình và trung bình, thì tổng khoảng cách bình phương gần như luôn luôn nhỏ hơn giá trị trung bình so với trung bình. Mặt khác, tổng khoảng cách tuyệt đối nhỏ hơn từ trung vị, sau đó từ trung bình. Mã R để tiến hành mô phỏng được đăng dưới đây.
sqtest <- function(x) sum((x-mean(x))^2) < sum((x-median(x))^2)
abstest <- function(x) sum(abs(x-mean(x))) > sum(abs(x-median(x)))
mean(replicate(1000, sqtest(rnorm(1000))))
mean(replicate(1000, abstest(rnorm(1000))))
mean(replicate(1000, sqtest(rexp(1000))))
mean(replicate(1000, abstest(rexp(1000))))
mean(replicate(1000, sqtest(runif(1000))))
mean(replicate(1000, abstest(runif(1000))))
Trong trường hợp sử dụng trung bình thay vì trung bình trong việc ước tính "phương sai" như vậy, điều này sẽ dẫn đến ước tính cao hơn so với sử dụng giá trị trung bình như được thực hiện theo truyền thống.
Nhân tiện, mối quan hệ của các chỉ tiêu L1 và L2 cũng có thể được xem xét trong bối cảnh Bayes, như trong chủ đề này .