Đây là một câu hỏi tuyệt vời vì nó khám phá khả năng của các thủ tục thay thế và yêu cầu chúng tôi suy nghĩ về lý do tại sao và làm thế nào một thủ tục có thể vượt trội hơn một thủ tục khác.
Câu trả lời ngắn gọn là có vô số cách chúng ta có thể nghĩ ra một quy trình để đạt giới hạn tin cậy thấp hơn cho giá trị trung bình, nhưng một số trong số này tốt hơn và một số xấu hơn (theo nghĩa có ý nghĩa và được xác định rõ). Tùy chọn 2 là một quy trình tuyệt vời, bởi vì một người sử dụng nó sẽ cần thu thập ít hơn một nửa dữ liệu so với một người sử dụng Tùy chọn 1 để có được kết quả có chất lượng tương đương. Một nửa số lượng dữ liệu thường có nghĩa là một nửa ngân sách và một nửa thời gian, vì vậy chúng tôi đang nói về một sự khác biệt quan trọng và kinh tế. Điều này cung cấp một minh chứng cụ thể về giá trị của lý thuyết thống kê.
Thay vì kiểm tra lại lý thuyết, trong đó có nhiều tài khoản sách giáo khoa xuất sắc, hãy nhanh chóng khám phá ba quy trình giới hạn độ tin cậy (LCL) thấp hơn cho bình thường độc lập của độ lệch chuẩn đã biết. Tôi đã chọn ba cái tự nhiên và đầy hứa hẹn được đề xuất bởi câu hỏi. Mỗi người trong số họ được xác định bởi mức độ tin cậy mong muốn :1 - an1−α
Tùy chọn 1a, thủ tục "tối thiểu" . Giới hạn tin cậy thấp hơn được đặt bằng . Giá trị của số được xác định sao cho khả năng sẽ vượt quá ý nghĩa thực sự chỉ là ; nghĩa là, .tmin=min(X1,X2,…,Xn)−kminα,n,σσkminα,n,σtminμαPr(tmin>μ)=α
Tùy chọn 1b, thủ tục "tối đa" . Giới hạn tin cậy thấp hơn được đặt bằng . Giá trị của số được xác định sao cho khả năng sẽ vượt quá trung bình thực chỉ là ; nghĩa là, .tmax=max(X1,X2,…,Xn)−kmaxα,n,σσkmaxα,n,σtmaxμαPr(tmax>μ)=α
Tùy chọn 2, thủ tục "trung bình" . Giới hạn tin cậy thấp hơn được đặt bằng . Giá trị của số được xác định sao cho khả năng sẽ vượt quá giá trị trung bình đúng chỉ là ; nghĩa là, .tmean=mean(X1,X2,…,Xn)−kmeanα,n,σσkmeanα,n,σtmeanμαPr(tmean>μ)=α
Như đã biết, trong đó ; là hàm xác suất tích lũy của phân phối chuẩn. Đây là công thức được trích dẫn trong câu hỏi. Một tốc ký toán học làkmeanα,n,σ=zα/n−−√Φ(zα)=1−αΦ
- kmeanα,n,σ=Φ−1(1−α)/n−−√.
Các công thức cho các thủ tục tối thiểu và tối thiểu ít được biết đến nhưng dễ xác định:
kminα,n,σ=Φ−1(1−α1/n) .
kmaxα,n,σ=Φ−1((1−α)1/n) .
Bằng phương pháp mô phỏng, chúng ta có thể thấy rằng cả ba công thức đều hoạt động. Đoạn R
mã sau tiến hành n.trials
thời gian thử nghiệm riêng biệt và báo cáo cả ba LCL cho mỗi thử nghiệm:
simulate <- function(n.trials=100, alpha=.05, n=5) {
z.min <- qnorm(1-alpha^(1/n))
z.mean <- qnorm(1-alpha) / sqrt(n)
z.max <- qnorm((1-alpha)^(1/n))
f <- function() {
x <- rnorm(n);
c(max=max(x) - z.max, min=min(x) - z.min, mean=mean(x) - z.mean)
}
replicate(n.trials, f())
}
(Mã không bận tâm để làm việc với các phân phối bình thường chung: vì chúng tôi có thể tự do chọn đơn vị đo và số 0 của thang đo, nên đủ để nghiên cứu trường hợp , Đó là lý do tại sao không có công thức nào cho các thực sự phụ thuộc vào .)μ=0σ=1k∗α,n,σσ
10.000 thử nghiệm sẽ cung cấp đủ độ chính xác. Hãy chạy mô phỏng và tính tần suất mà mỗi quy trình không tạo ra giới hạn tin cậy nhỏ hơn giá trị trung bình thực:
set.seed(17)
sim <- simulate(10000, alpha=.05, n=5)
apply(sim > 0, 1, mean)
Đầu ra là
max min mean
0.0515 0.0527 0.0520
Các tần số này đủ gần với giá trị quy định của để chúng tôi có thể hài lòng cả ba quy trình hoạt động như quảng cáo: mỗi quy trình tạo ra giới hạn tin cậy thấp hơn 95% cho giá trị trung bình.α=.05
(Nếu bạn lo ngại rằng các tần số khác nhau đôi chút từ , bạn có thể chạy thử nghiệm hơn Với một triệu thử nghiệm, họ đến gần gũi hơn với. : .).05.05(0.050547,0.049877,0.050274)
Tuy nhiên, một điều chúng tôi muốn về bất kỳ thủ tục LCL nào là nó không chỉ nên chính xác theo tỷ lệ thời gian dự định mà còn có xu hướng gần đúng. Ví dụ, hãy tưởng tượng một nhà thống kê (giả thuyết), nhờ khả năng cảm thụ tôn giáo sâu sắc, có thể tham khảo nhà tiên tri Delphic (của Apollo) thay vì thu thập dữ liệu và thực hiện tính toán LCL. Khi cô ấy yêu cầu vị thần cho LCL 95%, vị thần sẽ chỉ nói lên ý nghĩa thực sự và nói điều đó với cô ấy - sau tất cả, anh ấy hoàn hảo. Nhưng, bởi vì thần không muốn chia sẻ đầy đủ khả năng của mình với loài người (mà vẫn phải có thể nói được), 5% thời gian anh ta sẽ đưa ra một LCL làX1,X2,…,Xn100σquá cao. Thủ tục Delphic này cũng là 95% LCL - nhưng nó sẽ là một điều đáng sợ để sử dụng trong thực tế do nguy cơ nó tạo ra một ràng buộc thực sự khủng khiếp.
Chúng tôi có thể đánh giá mức độ chính xác của ba thủ tục LCL của chúng tôi. Một cách tốt là xem xét các phân phối lấy mẫu của họ: tương tự, biểu đồ của nhiều giá trị mô phỏng cũng sẽ làm như vậy. Họ đây rồi. Trước tiên, mã để sản xuất chúng:
dx <- -min(sim)/12
breaks <- seq(from=min(sim), to=max(sim)+dx, by=dx)
par(mfcol=c(1,3))
tmp <- sapply(c("min", "max", "mean"), function(s) {
hist(sim[s,], breaks=breaks, col="#70C0E0",
main=paste("Histogram of", s, "procedure"),
yaxt="n", ylab="", xlab="LCL");
hist(sim[s, sim[s,] > 0], breaks=breaks, col="Red", add=TRUE)
})

Chúng được hiển thị trên các trục x giống hệt nhau (nhưng trục dọc hơi khác nhau). Điều chúng tôi quan tâm là
Các phần màu đỏ ở bên phải của đó các khu vực biểu thị tần suất mà các quy trình không đánh giá thấp giá trị trung bình - tất cả đều bằng với số tiền mong muốn, . (Chúng tôi đã xác nhận rằng bằng số.)0α=.05
Sự lây lan của kết quả mô phỏng. Rõ ràng, biểu đồ ngoài cùng bên phải hẹp hơn hai biểu đồ kia: nó mô tả một quy trình thực sự đánh giá thấp trung bình (bằng ) hoàn toàn % thời gian, nhưng ngay cả khi nó, việc đánh giá thấp đó hầu như luôn nằm trong của đúng nghĩa Hai biểu đồ khác có xu hướng đánh giá thấp giá trị trung bình thực hơn một chút, khoảng quá thấp. Ngoài ra, khi họ đánh giá quá cao ý nghĩa thực sự, họ có xu hướng đánh giá quá cao nó hơn là thủ tục ngoài cùng. Những phẩm chất này làm cho chúng thấp hơn biểu đồ ngoài cùng bên phải.0952σ3σ
Biểu đồ ngoài cùng bên phải mô tả Tùy chọn 2, thủ tục LCL thông thường.
Một thước đo của các chênh lệch này là độ lệch chuẩn của kết quả mô phỏng:
> apply(sim, 1, sd)
max min mean
0.673834 0.677219 0.453829
Những con số này cho chúng ta biết rằng các thủ tục tối đa và tối thiểu có mức chênh lệch bằng nhau (khoảng ) và quy trình thông thường, trung bình , chỉ có khoảng hai phần ba mức chênh lệch của chúng (khoảng ). Điều này xác nhận bằng chứng của đôi mắt của chúng tôi.0.680.45
Bình phương của độ lệch chuẩn là phương sai, tương ứng bằng , và . Phương sai có thể liên quan đến lượng dữ liệu : nếu một nhà phân tích đề xuất quy trình tối đa (hoặc tối thiểu ), thì để đạt được mức chênh lệch hẹp được thể hiện bằng thủ tục thông thường, khách hàng của họ sẽ phải lấy được lần dữ liệu - hơn gấp đôi. Nói cách khác, bằng cách sử dụng Tùy chọn 1, bạn sẽ phải trả nhiều hơn gấp đôi cho thông tin của mình so với sử dụng Tùy chọn 2.0.450.450.200.45/0.21