Chỉ vì tóm tắt năm số giống hệt nhau không có nghĩa là phân phối giống hệt nhau. Điều này cho bạn biết có bao nhiêu thông tin bị mất khi chúng tôi trình bày dữ liệu bằng đồ họa trong một ô vuông!
Có lẽ cách dễ nhất để thấy vấn đề là tóm tắt năm số không cho bạn biết gì về sự phân bố các giá trị giữa phần tư tối thiểu và phần dưới, hoặc giữa phần tư thấp hơn và phần trung vị, v.v. Bạn biết rằng tần số giữa phân vị tối thiểu và thấp hơn phải phù hợp với tần số giữa phân vị thấp hơn và trung vị (với các ngoại lệ rõ ràng, ví dụ: nếu chúng ta có dữ liệu nằm trên một phần tư, hoặc tệ hơn, nếu hai phần tư được gắn kết) nhưng không biết giá trị nào của biến các tần số được phân bổ. Chúng ta có thể có một tình huống như thế này:
XYYXR
Y
EDIT: Như @Glen_b nói, điều này càng trở nên rõ ràng hơn khi bạn nhìn vào các bản phân phối tích lũy. Tôi đã thêm các đường lưới để hiển thị vị trí của các phần tư, giống nhau cho hai bản phân phối để các CDF theo kinh nghiệm của chúng giao nhau.
Mã R
yfreq <- 2*rep(c(1:10, 10:1), times=4)
xfreq <- rep(mean(yfreq), times=length(yfreq))
x <- rep(1:length(xfreq), times=xfreq)
y <- rep(1:length(yfreq), times=yfreq)
ecdfX <- ecdf(x)
ecdfY <- ecdf(y)
plot(ecdfX, verticals=TRUE, do.points=FALSE, col="blue", lwd=2, yaxt="n",
main="Empirical CDFs", xlab="", ylab="Relative cumulative frequency")
plot(ecdfY, verticals=TRUE, do.points=FALSE, add=TRUE, col="black",
yaxt="n", lwd=2)
axis(side=2, at=seq(0, 1, by=0.1), las=2)
abline(h=c(0.25,0.5,0.75,1), col="lightgrey", lty="dashed")
abline(v=summary(x), col="lightgrey", lty="dashed")
legend("right", c("x", "y"), col = c("blue", "black"),
lty = "solid", lwd=2, bty="n")
par(mfrow=c(2,2))
hist(x, col="steelblue", breaks=((0:81)-0.5), ylim=c(0,25))
hist(y, col="grey", breaks=((0:81)-0.5), ylim=c(0,25))
boxplot(x, col="steelblue", main="Boxplot of x")
boxplot(y, col="grey", main="Boxplot of y")
summary(x)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 1.00 20.75 40.50 40.50 60.25 80.00
summary(y)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 1.00 20.75 40.50 40.50 60.25 80.00