Vì chỉ là một yếu tố tỷ lệ, nên không mất tính tổng quát, chọn các đơn vị đo lường tạo ra , làm cho hàm phân phối cơ bản với mật độ .λ = 1 F ( x ) = 1 - exp ( - x ) f ( x ) = exp ( - x )λλ=1F(x)=1−exp(−x)f(x)=exp(−x)
Từ các cân nhắc song song với các định lý giới hạn trung tâm cho các trung vị mẫu , là không bình thường với trung bình và phương sai F - 1 ( p ) = - log ( 1 - p )X(m)F−1(p)=−log(1−p)
Var(X(m))=p(1−p)nf(−log(1−p))2=pn(1−p).
Do sở hữu không nhớ của phân phối mũ , các biến hành động như số liệu thống kê thứ tự của một mẫu ngẫu nhiên rút ra từ , mà đã được thêm vào. Viếtn - m F X ( m )(X(m+1),…,X(n))n−mFX(m)
Y=1n−m∑i=m+1nX(i)
đối với giá trị trung bình của chúng, ngay lập tức giá trị trung bình của là giá trị trung bình của (bằng ) và phương sai của là với phương sai của (cũng bằng ). Định lý giới hạn trung tâm ngụ ý chuẩn hóa là chuẩn Bình thường không có triệu chứng. Hơn nữa, vì là có điều kiện độc lập của , chúng tôi đồng thời có phiên bản tiêu chuẩn của trở thành tiệm cận tiêu chuẩn bình thường và không tương quan với . Đó là,Y1 Y 1 / ( n - m ) F 1 Y Y X ( m ) X ( m ) YF1Y1/(n−m)F1YYX(m)X(m)Y
(X(m)+log(1−p)p/(n(1−p))−−−−−−−−−−√,Y−X(m)−1n−m−−−−−√)(1)
tiệm cận có phân phối chuẩn bivariate.
Báo cáo đồ họa về dữ liệu mô phỏng cho các mẫu ( lần lặp) và . Dấu vết của sự sai lệch tích cực vẫn còn, nhưng cách tiếp cận với tính quy tắc hai biến thể hiện rõ trong việc thiếu mối quan hệ giữa và và sự gần gũi của biểu đồ với mật độ Chuẩn thông thường (thể hiện trong chấm đỏ).
500 p = 0,95 Y - X ( mn=1000500p=0.95 X ( m )Y−X(m)X(m)
Ma trận hiệp phương sai của các giá trị được tiêu chuẩn hóa (như trong công thức ) cho mô phỏng này là gần với ma trận đơn vị mà nó xấp xỉ.( 0,967 -(1)
(0.967−0.021−0.0211.010),
Các R
mã mà tạo ra những hình ảnh được dễ dàng sửa đổi để nghiên cứu các giá trị khác của , , và kích thước mô phỏng.pnp
n <- 1e3
p <- 0.95
n.sim <- 5e3
#
# Perform the simulation.
# X_m will be in the first column and Y in the second.
#
set.seed(17)
m <- floor(p * n)
X <- apply(matrix(rexp(n.sim * n), nrow = n), 2, sort)
X <- cbind(X[m, ], colMeans(X[(m+1):n, , drop=FALSE]))
#
# Display the results.
#
par(mfrow=c(2,2))
plot(X[,1], X[,2], pch=16, col="#00000020",
xlab=expression(X[(m)]), ylab="Y",
main="Y vs X", sub=paste("n =", n, "and p =", signif(p, 2)))
plot(X[,1], X[,2]-X[,1], pch=16, col="#00000020",
xlab=expression(X[(m)]), ylab=expression(Y - X[(m)]),
main="Y-X vs X", sub="Loess smooth shown")
lines(lowess(X[,2]-X[,1] ~ X[,1]), col="Red", lwd=3, lty=1)
x <- (X[,1] + log(1-p)) / sqrt(p/(n*(1-p)))
hist(x, main="Standardized X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
y <- (X[,2] - X[,1] - 1) * sqrt(n-m)
hist(y, main="Standardized Y-X", freq=FALSE, xlab="Value")
curve(dnorm(x), add=TRUE, col="Red", lty=3, lwd=2)
par(mfrow=c(1,1))
round(var(cbind(x,y)), 3) # Should be close to the unit matrix