Trong lĩnh vực nghiên cứu của tôi, một cách hiển thị dữ liệu phổ biến là sử dụng kết hợp biểu đồ thanh với "thanh tay cầm". Ví dụ,
"Thanh tay cầm" xen kẽ giữa các lỗi tiêu chuẩn và độ lệch chuẩn tùy thuộc vào tác giả. Thông thường, kích thước mẫu cho mỗi "thanh" khá nhỏ - khoảng sáu.
Những mảnh đất này dường như đặc biệt phổ biến trong khoa học sinh học - xem một vài bài báo đầu tiên của BMC Biology, tập 3 để biết ví dụ.
Vì vậy, làm thế nào bạn sẽ trình bày dữ liệu này?
Tại sao tôi không thích những mảnh đất này
Cá nhân tôi không thích những mảnh đất này.
- Khi kích thước mẫu nhỏ, tại sao không chỉ hiển thị các điểm dữ liệu riêng lẻ.
- Đó là sd hoặc se đang được hiển thị? Không ai đồng ý sử dụng.
- Tại sao lại sử dụng thanh nào cả. Dữ liệu không (thường) đi từ 0 nhưng lần đầu tiên tại biểu đồ cho thấy điều đó.
- Các biểu đồ không đưa ra ý tưởng về phạm vi hoặc kích thước mẫu của dữ liệu.
Kịch bản R
Đây là mã R tôi đã sử dụng để tạo cốt truyện. Bằng cách đó bạn có thể (nếu bạn muốn) sử dụng cùng một dữ liệu.
#Generate the data
set.seed(1)
names = c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
prevs = c(38, 37, 31, 31, 29, 26, 40, 32, 39)
n=6; se = numeric(length(prevs))
for(i in 1:length(prevs))
se[i] = sd(rnorm(n, prevs, 15))/n
#Basic plot
par(fin=c(6,6), pin=c(6,6), mai=c(0.8,1.0,0.0,0.125), cex.axis=0.8)
barplot(prevs,space=c(0,0,0,3,0,0, 3,0,0), names.arg=NULL, horiz=FALSE,
axes=FALSE, ylab="Percent", col=c(2,3,4), width=5, ylim=range(0,50))
#Add in the CIs
xx = c(2.5, 7.5, 12.5, 32.5, 37.5, 42.5, 62.5, 67.5, 72.5)
for (i in 1:length(prevs)) {
lines(rep(xx[i], 2), c(prevs[i], prevs[i]+se[i]))
lines(c(xx[i]+1/2, xx[i]-1/2), rep(prevs[i]+se[i], 2))
}
#Add the axis
axis(2, tick=TRUE, xaxp=c(0, 50, 5))
axis(1, at=xx+0.1, labels=names, font=1,
tck=0, tcl=0, las=1, padj=0, col=0, cex=0.1)