Phân tích
Bởi vì đây là một câu hỏi khái niệm, vì đơn giản chúng ta hãy xem xét tình hình trong đó một khoảng tin cậy [ ˉ x ( 1 ) + Z α /1−αđược xây dựng cho một bìnhμsử dụng một mẫu ngẫu nhiênx(1)
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1) kích thước
và một giây ngẫu nhiên mẫu
x ( 2 ) được lấy kích thước
m , tất cả từ bình thường cùng
( μ , σ 2 ) phân phối. (Nếu bạn thích bạn có thể thay thế
Z s bằng giá trị từ Student
t phân phối của
n - 1 bậc tự do; các phân tích sau đây sẽ không thay đổi.)
nx(2)m(μ,σ2)Ztn−1
Cơ hội mà giá trị trung bình của mẫu thứ hai nằm trong CI được xác định bởi mẫu thứ nhất là
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
Do trung bình mẫu thứ nhất không phụ thuộc vào độ lệch chuẩn mẫu thứ nhất s ( 1 ) (điều này đòi hỏi tính quy tắc) và mẫu thứ hai độc lập với mẫu thứ nhất, sự khác biệt trong mẫu có nghĩa là U = ˉ x ( 2 ) - ˉ x ( 1 )x¯(1)s(1)U=x¯(2)−x¯(1) độc lập với . Hơn nữa, đối với khoảng đối xứng này Z α / 2 = - Z 1 - α / 2s(1)Zα/2=−Z1−α/2. Do đó, viết cho biến ngẫu nhiên s ( 1 ) và bình phương cả hai bất đẳng thức, xác suất trong câu hỏi là giống nhưSs(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
Định luật kỳ vọng ngụ ý có giá trị trung bình bằng 0 và phương sai củaU0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
Vì là tổ hợp tuyến tính của các biến Bình thường, nên nó cũng có phân phối Bình thường. Do đó U 2 là σ 2 ( 1UU2lần một biếnχ2(1). Chúng ta đã biết rằngS2làσ2/nlần một biếnχ2(n-1). Do đó,U2/S2là1/n+1/mlần một biến với mộtF(1,n-1)phân phối. σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)Xác suất bắt buộc được đưa ra bởi phân phối F là
F1,n−1(Z21−α/21+n/m).(1)
Thảo luận
Một trường hợp thú vị là khi mẫu thứ hai có cùng kích thước với mẫu thứ nhất, sao cho và chỉ n và α xác định xác suất. Dưới đây là các giá trị của ( 1 ) được vẽ trên αn/m=1nα(1)α cho .n=2,5,20,50
Các đồ thị tăng đến một giá trị giới hạn tại mỗi khi n tăng. Kích thước thử nghiệm truyền thống α = 0,05 được đánh dấu bằng một đường màu xám dọc. Đối với các giá trị lớn củaαnα=0.05 , cơ hội giới hạn cho α = 0,05 là khoảng 85 % .n=mα=0.0585%
Bằng cách hiểu giới hạn này, chúng tôi sẽ xem qua các chi tiết về kích thước mẫu nhỏ và hiểu rõ hơn mấu chốt của vấn đề. Khi phát triển lớn, phân phối F đạt tới χ 2n=mF . Xét về mặt phân phối bình thường tiêu chuẩn Φ , xác suất ( 1 ) sau đó xấp xỉχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
Ví dụ, với , Z α / 2 / √α=0.05vàΦ(-1.386)≈0,083. Do đó, giá trị giới hạn đạt được của các đường cong tạiα=0,05khintăng sẽ là1-2(0,083)=1-0,166=0,834. Bạn có thể thấy nó đã gần như đạt được chon=50(trong đó có cơ hội là0,8383....)Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
Đối với nhỏ , mối quan hệ giữa α và xác suất bổ sung - rủi ro mà CI không bao gồm trung bình thứ hai - gần như hoàn toàn là một định luật lũy thừa. αα Một cách khác để diễn đạt điều này là xác suất bổ sung log gần như là một hàm tuyến tính của . Mối quan hệ hạn chế là khoảnglogα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
Nói cách khác, với và α lớn ở bất kỳ đâu gần giá trị truyền thống 0,05 , ( 1 ) sẽ gần vớin=mα0.05(1)
1−0.166(20α)0.557.
(Điều này nhắc nhở tôi rất nhiều về phân tích các khoảng tin cậy chồng chéo mà tôi đã đăng tại /stats//a/18259/919 . Thật vậy, sức mạnh ma thuật ở đó, , gần như là sự đối nghịch của sức mạnh ma thuật đây, 0,5571.910.557 . Tại thời điểm này, bạn sẽ có thể diễn giải lại phân tích đó về khả năng tái tạo của các thí nghiệm.)
Kết quả thực nghiệm
Những kết quả này được xác nhận với một mô phỏng đơn giản. Đoạn R
mã sau trả về tần suất bao phủ, cơ hội được tính bằng và điểm Z để đánh giá mức độ khác nhau của chúng. Z-score thường ít hơn 2 về kích thước, không phân biệt n , m , μ , σ , α (hoặc thậm chí cho dù một Z hoặc t CI được tính), cho thấy sự đúng đắn của công thức ( 1 ) .(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))