Độ lệch chuẩn có thể được tính cho trung bình hài? Tôi hiểu rằng độ lệch chuẩn có thể được tính cho trung bình số học, nhưng nếu bạn có trung bình hài, làm thế nào để bạn tính độ lệch chuẩn hoặc CV?
Độ lệch chuẩn có thể được tính cho trung bình hài? Tôi hiểu rằng độ lệch chuẩn có thể được tính cho trung bình số học, nhưng nếu bạn có trung bình hài, làm thế nào để bạn tính độ lệch chuẩn hoặc CV?
Câu trả lời:
Giá trị trung bình hài của của các biến ngẫu nhiên được định nghĩa là
Chụp những khoảnh khắc của các phần phân đoạn là một doanh nghiệp lộn xộn, vì vậy thay vào đó tôi muốn làm việc với . Hiện nay
Định lý giới hạn trung tâm chúng ta ngay lập tức có được điều đó
nếu tất nhiên và đang IID, vì chúng ta đơn giản làm việc với trung bình cộng của biến .
Bây giờ sử dụng phương thức delta cho hàm chúng ta nhận được rằng
Kết quả này không có triệu chứng, nhưng đối với các ứng dụng đơn giản, nó có thể đủ.
Cập nhật Như @whuber chỉ ra một cách chính xác, các ứng dụng đơn giản là một cách viết sai. Định lý giới hạn trung tâm chỉ giữ nếu tồn tại, đây là một giả định khá hạn chế.
Cập nhật 2 Nếu bạn có một mẫu, sau đó để tính độ lệch chuẩn, chỉ cần cắm các khoảnh khắc mẫu vào công thức. Vì vậy, đối với mẫu , ước tính trung bình hài là
các khoảnh khắc mẫu và lần lượt là:
ở đây là viết tắt của đối ứng.
Cuối cùng công thức gần đúng cho độ lệch chuẩn của H là
Tôi đã chạy một số mô phỏng Monte-Carlo cho các biến ngẫu nhiên được phân phối đồng đều trong khoảng . Đây là mã:
hm <- function(x)1/mean(1/x)
sdhm <- function(x)sqrt((mean(1/x))^(-4)*var(1/x)/length(x))
n<-1000
nn <- c(10,30,50,100,500,1000,5000,10000)
N<-1000
mc<-foreach(n=nn,.combine=rbind) %do% {
rr <- matrix(runif(n*N,min=2,max=3),nrow=N)
c(n,mean(apply(rr,1,sdhm)),sd(apply(rr,1,sdhm)),sd(apply(rr,1,hm)))
}
colnames(mc) <- c("n","DeltaSD","sdDeltaSD","trueSD")
> mc
n DeltaSD sdDeltaSD trueSD
result.1 10 0.089879211 1.528423e-02 0.091677622
result.2 30 0.052870477 4.629262e-03 0.051738941
result.3 50 0.040915607 2.705137e-03 0.040257673
result.4 100 0.029017031 1.407511e-03 0.028284458
result.5 500 0.012959582 2.750145e-04 0.013200580
result.6 1000 0.009139193 1.357630e-04 0.009115592
result.7 5000 0.004094048 2.685633e-05 0.004070593
result.8 10000 0.002894254 1.339128e-05 0.002964259
Tôi mô phỏng N
các mẫu của n
kích thước mẫu. Đối với mỗi n
mẫu có kích thước tôi tính toán ước tính tiêu chuẩn (hàm sdhm
). Sau đó, tôi so sánh độ lệch trung bình và độ lệch chuẩn của các ước tính này với độ lệch chuẩn của mẫu trung bình hài được ước tính cho mỗi mẫu, có thể giả sử là độ lệch chuẩn thực của trung bình hài.
Như bạn có thể thấy kết quả khá tốt ngay cả đối với cỡ mẫu vừa phải. Tất nhiên phân phối đồng phục là một hành vi rất tốt, vì vậy không có gì đáng ngạc nhiên khi kết quả là tốt. Tôi sẽ để người khác điều tra hành vi cho các bản phân phối khác, mã rất dễ thích nghi.
Lưu ý: Trong phiên bản trước của câu trả lời này, có một lỗi trong kết quả của phương thức delta, phương sai không chính xác.
Nhược điểm chính là tính toán không tạo ra khoảng tin cậy tốt cho các phân phối cơ bản bị sai lệch cao. Đó có thể là một vấn đề với bất kỳ phương pháp có mục đích chung nào: trung bình hài hòa rất nhạy cảm với sự hiện diện của ngay cả một giá trị nhỏ trong tập dữ liệu.
Đây là R
mã cho các mô phỏng và số liệu.
k <- 5 # Gamma parameter
n <- 12 # Sample size
hm <- k-1 # True harmonic mean
set.seed(17)
t.crit <- -qt(0.05/2, n-1)
par(mfrow=c(4, 5))
for(i in 1:20) {
#
# Generate a random sample.
#
x <- rgamma(n, k)
#
# Estimate the harmonic mean.
#
fit <- lm(x ~ 1, weights=1/x)
beta <- coef(summary(fit))[1, ]
message("Harmonic mean estimate is ", signif(beta["Estimate"], 3),
" +/- ", signif(beta["Std. Error"], 3))
#
# Plot the results.
#
covers <- abs(beta["Estimate"] - hm) <= t.crit*beta["Std. Error"]
plot(ecdf(x), main="Empirical CDF", sub=ifelse(covers, "", "***"))
rect(beta["Estimate"] - t.crit*beta["Std. Error"], 0,
beta["Estimate"] + t.crit*beta["Std. Error"], 1.25,
border=NA, col=gray(0.5, alpha=0.10))
abline(v = hm, col="Blue", lwd=2)
abline(v = beta["Estimate"], col="Red", lty=3, lwd=2)
}
Đây là một ví dụ cho r.v's Exponential.
Phương sai (và độ lệch chuẩn) của rv này được biết đến, xem, ví dụ ở đây .