Các nhóm tự tin cho dòng QQ


14

Câu hỏi này không liên quan cụ thể R, nhưng tôi đã chọn sử dụng Rđể minh họa nó.

Xem xét mã để sản xuất các dải tin cậy quanh một qq-line (bình thường):

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

Tôi đang tìm kiếm một lời giải thích (hoặc thay thế một liên kết đến một tài liệu trực tuyến / tài liệu giải thích) cách thức các dải tin cậy này được xây dựng (Tôi đã thấy một tài liệu tham khảo về Fox 2002 trong các tệp trợ giúp của R nhưng thật đáng buồn là tôi không có điều này sách tiện dụng).

Câu hỏi của tôi sẽ được thực hiện chính xác hơn với một ví dụ. Dưới đây là cách Rtính các CI cụ thể này (Tôi đã rút ngắn / đơn giản hóa mã được sử dụng trong car::qqPlot)

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

Câu hỏi là: sự biện minh cho công thức được sử dụng để tính các SE này là gì (ví dụ: dòng SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)).

FWIW công thức này rất khác với công thức của các dải tin cậy thông thường được sử dụng trong hồi quy tuyến tính


2
Tôi hy vọng nó sẽ làm được với việc phân phối số liệu thống kê đơn hàng và đặc biệt hơnlà kết quả tiệm cận:X(np)~MộtN(F-1(p
fX(k)(x)=n!(k1)!(nk)![FX(x)]k1[1FX(x)]nkfX(x)
X(np)AN(F1(p),p(1p)n[f(F1(p))]2)
Glen_b -Reinstate Monica

4
@Glen_b nói đúng. John Fox viết trên các trang 35-36: "Các sai số chuẩn của trật tự thống kê S E ( X ( i ) ) = σX(i)
SE(X(i))=σ^p(zi)Pi(1Pi)n
p(z)P(z)X^(i)=μ^+σ^ziX^(i)±2×SE(X(i))

2
f(F-1(p))(p(zi)/σ^)

Câu trả lời:


6

Nó có liên quan đến việc phân phối số liệu thống kê đơn hàng

fX(k)(x)= =n!(k-1)!(n-k)![FX(x)]k-1[1-FX(x)]n-kfX(x)
và đặc biệt hơn là kết quả tiệm cận :
X(np)~MộtN(F-1(p),p(1-p)n[f(F-1(p))]2)

As COOLSerdash mentions in comments, John Fox [1] writes on pages 35-36:

The standard error of the order statistic X(i) is

SE(X(i))=σ^p(zi)Pi(1Pi)n
where p(z) is the probability density function corresponding to the CDF P(z). The values along the fitted line are given by X^(i)=μ^+σ^zi. An approximate 95% confidence "envelope" around the fitted line is, therefore, X^(i)±2×SE(X(i)).

Then we just need to recognize that f(F1(p)) is estimated by (p(zi)/σ^).

[1] Fox, J. (2008),
Applied Regression Analysis and Generalized Linear Models, 2nd Ed.,
Sage Publications, Inc

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.