ANCOVA trong R gợi ý các lần chặn khác nhau, nhưng 95% các TCTD trùng lặp với nhau thì làm sao có thể như vậy?

9

Chúng tôi có một bộ dữ liệu với hai biến số và biến nhóm phân loại và muốn biết liệu có sự khác biệt đáng kể giữa độ dốc hoặc chặn giữa các hiệp phương sai liên quan đến các biến nhóm khác nhau hay không. Chúng tôi đã sử dụng anova () và lm () để so sánh sự phù hợp của ba mô hình khác nhau: 1) với một độ dốc và chặn, 2) với các mức chặn khác nhau cho mỗi nhóm và 3) với độ dốc và chặn cho mỗi nhóm . Theo thử nghiệm tuyến tính chung anova (), mô hình thứ hai là phù hợp nhất trong ba mô hình, có một sự cải tiến đáng kể cho mô hình bằng cách bao gồm một đánh chặn riêng cho mỗi nhóm. Tuy nhiên, khi chúng tôi xem xét khoảng tin cậy 95% cho các lần chặn này - tất cả chúng đều trùng nhau, cho thấy không có sự khác biệt đáng kể giữa các lần chặn. Làm thế nào hai kết quả này có thể được hòa giải? Chúng tôi đã nghĩ một cách khác để diễn giải kết quả của phương pháp lựa chọn mô hình là phải có ít nhất một sự khác biệt đáng kể giữa các lần chặn ... nhưng có lẽ điều này không đúng?

Dưới đây là mã R để sao chép phân tích này. Chúng tôi đã sử dụng hàm dput () để bạn có thể làm việc với chính xác cùng một dữ liệu mà chúng tôi đang vật lộn với.

# Begin R Script
# > dput(data)
structure(list(Head = c(1.92, 1.93, 1.79, 1.94, 1.91, 1.88, 1.91, 
1.9, 1.97, 1.97, 1.95, 1.93, 1.95, 2, 1.87, 1.88, 1.97, 1.88, 
1.89, 1.86, 1.86, 1.97, 2.02, 2.04, 1.9, 1.83, 1.95, 1.87, 1.93, 
1.94, 1.91, 1.96, 1.89, 1.87, 1.95, 1.86, 2.03, 1.88, 1.98, 1.97, 
1.86, 2.04, 1.86, 1.92, 1.98, 1.86, 1.83, 1.93, 1.9, 1.97, 1.92, 
2.04, 1.92, 1.9, 1.93, 1.96, 1.91, 2.01, 1.97, 1.96, 1.76, 1.84, 
1.92, 1.96, 1.87, 2.1, 2.17, 2.1, 2.11, 2.17, 2.12, 2.06, 2.06, 
2.1, 2.05, 2.07, 2.2, 2.14, 2.02, 2.08, 2.16, 2.11, 2.29, 2.08, 
2.04, 2.12, 2.02, 2.22, 2.22, 2.2, 2.26, 2.15, 2, 2.24, 2.18, 
2.07, 2.06, 2.18, 2.14, 2.13, 2.2, 2.1, 2.13, 2.15, 2.25, 2.14, 
2.07, 1.98, 2.16, 2.11, 2.21, 2.18, 2.13, 2.06, 2.21, 2.08, 1.88, 
1.81, 1.87, 1.88, 1.87, 1.79, 1.99, 1.87, 1.95, 1.91, 1.99, 1.85, 
2.03, 1.88, 1.88, 1.87, 1.85, 1.94, 1.98, 2.01, 1.82, 1.85, 1.75, 
1.95, 1.92, 1.91, 1.98, 1.92, 1.96, 1.9, 1.86, 1.97, 2.06, 1.86, 
1.91, 2.01, 1.73, 1.97, 1.94, 1.81, 1.86, 1.99, 1.96, 1.94, 1.85, 
1.91, 1.96, 1.9, 1.98, 1.89, 1.88, 1.95, 1.9, 1.94, NA, 1.84, 
1.83, 1.84, 1.96, 1.74, 1.91, 1.84, 1.88, 1.83, 1.93, 1.78, 1.88, 
1.93, 2.15, 2.16, 2.23, 2.09, 2.36, 2.31, 2.25, 2.29, 2.3, 2.04, 
2.22, 2.19, 2.25, 2.31, 2.3, 2.28, 2.25, 2.15, 2.29, 2.24, 2.34, 
2.2, 2.24, 2.17, 2.26, 2.18, 2.17, 2.34, 2.23, 2.36, 2.31, 2.13, 
2.2, 2.27, 2.27, 2.2, 2.34, 2.12, 2.26, 2.18, 2.31, 2.24, 2.26, 
2.15, 2.29, 2.14, 2.25, 2.31, 2.13, 2.09, 2.24, 2.26, 2.26, 2.21, 
2.25, 2.29, 2.15, 2.2, 2.18, 2.16, 2.14, 2.26, 2.22, 2.12, 2.12, 
2.16, 2.27, 2.17, 2.27, 2.17, 2.3, 2.25, 2.17, 2.27, 2.06, 2.13, 
2.11, 2.11, 1.97, 2.09, 2.06, 2.11, 2.09, 2.08, 2.17, 2.12, 2.13, 
1.99, 2.08, 2.01, 1.97, 1.97, 2.09, 1.94, 2.06, 2.09, 2.04, 2, 
2.14, 2.07, 1.98, 2, 2.19, 2.12, 2.06, 2, 2.02, 2.16, 2.1, 1.97, 
1.97, 2.1, 2.02, 1.99, 2.13, 2.05, 2.05, 2.16, 2.02, 2.02, 2.08, 
1.98, 2.04, 2.02, 2.07, 2.02, 2.02, 2.02), Site = structure(c(2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 
5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 
5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 
5L, 5L, 5L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 
3L, 3L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 
4L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 6L, 
6L, 6L, 6L, 6L, 6L, 6L, 6L), .Label = c("ANZ", "BC", "DV", "MC", 
"RB", "WW"), class = "factor"), Leg = c(2.38, 2.45, 2.22, 2.23, 
2.26, 2.32, 2.28, 2.17, 2.39, 2.27, 2.42, 2.33, 2.31, 2.32, 2.25, 
2.27, 2.38, 2.28, 2.33, 2.24, 2.21, 2.22, 2.42, 2.23, 2.36, 2.2, 
2.28, 2.23, 2.33, 2.35, 2.36, 2.26, 2.26, 2.3, 2.23, 2.31, 2.27, 
2.23, 2.37, 2.27, 2.26, 2.3, 2.33, 2.34, 2.27, 2.4, 2.22, 2.25, 
2.28, 2.33, 2.26, 2.32, 2.29, 2.31, 2.37, 2.24, 2.26, 2.36, 2.32, 
2.32, 2.15, 2.2, 2.29, 2.37, 2.26, 2.24, 2.23, 2.24, 2.26, 2.18, 
2.11, 2.23, 2.31, 2.25, 2.15, 2.3, 2.33, 2.35, 2.21, 2.36, 2.27, 
2.24, 2.35, 2.24, 2.33, 2.32, 2.24, 2.35, 2.36, 2.39, 2.28, 2.36, 
2.19, 2.27, 2.39, 2.23, 2.29, 2.32, 2.3, 2.32, NA, 2.25, 2.24, 
2.21, 2.37, 2.21, 2.21, 2.27, 2.27, 2.26, 2.19, 2.2, 2.25, 2.25, 
2.25, NA, 2.24, 2.17, 2.2, 2.2, 2.18, 2.14, 2.17, 2.27, 2.28, 
2.27, 2.29, 2.23, 2.25, 2.33, 2.22, 2.29, 2.19, 2.15, 2.24, 2.24, 
2.26, 2.25, 2.09, 2.27, 2.18, 2.2, 2.25, 2.24, 2.18, 2.3, 2.26, 
2.18, 2.27, 2.12, 2.18, 2.33, 2.13, 2.28, 2.23, 2.16, 2.2, 2.3, 
2.31, 2.18, 2.33, 2.29, 2.26, 2.21, 2.22, 2.27, 2.32, 2.24, 2.25, 
2.17, 2.2, 2.26, 2.27, 2.24, 2.25, 2.09, 2.25, 2.21, 2.24, 2.21, 
2.22, 2.13, 2.24, 2.21, 2.3, 2.34, 2.35, 2.32, 2.46, 2.43, 2.42, 
2.41, 2.32, 2.25, 2.33, 2.19, 2.45, 2.32, 2.4, 2.38, 2.35, 2.39, 
2.29, 2.35, 2.43, 2.29, 2.33, 2.31, 2.28, 2.38, 2.32, 2.43, 2.27, 
2.4, 2.37, 2.27, 2.41, 2.32, 2.38, 2.23, 2.33, 2.21, 2.34, 2.19, 
2.34, 2.35, 2.35, 2.31, 2.33, 2.41, 2.53, 2.39, 2.17, 2.16, 2.38, 
2.34, 2.33, 2.33, 2.29, 2.43, 2.28, 2.34, 2.38, 2.3, 2.29, 2.43, 
2.36, 2.24, 2.35, 2.38, 2.4, 2.36, 2.42, 2.28, 2.45, 2.33, 2.32, 
2.33, 2.31, 2.44, 2.37, 2.4, 2.35, 2.33, 2.31, 2.36, 2.43, 2.38, 
2.4, 2.38, 2.46, 2.33, 2.38, 2.23, 2.24, 2.39, 2.36, 2.19, 2.32, 
2.37, 2.39, 2.34, 2.39, 2.23, 2.25, 2.29, 2.39, 2.35, NA, 2.28, 
2.35, 2.38, 2.34, 2.17, 2.29, NA, 2.26, NA, NA, NA, 2.24, 2.33, 
2.23, 2.28, 2.29, 2.23, 2.2, 2.27, 2.31, 2.31, 2.26, 2.28)), .Names = c("Head", 
"Site", "Leg"), class = "data.frame", row.names = c(NA, -312L
)) 

# plot graph
library(ggplot2)

qplot(Head, Leg, 
    color=Site, 
    data=data) + 
        stat_smooth(method="lm", alpha=0.2) + 
        theme_bw()

nhập mô tả hình ảnh ở đây

# create linear models
lm.1 <- lm(Leg ~ Head, data)
lm.2 <- lm(Leg ~ Head + Site, data)
lm.3 <- lm(Leg ~ Head*Site, data)

# evaluate linear models
anova(lm.1, lm.2, lm.3)
anova(lm.1, lm.2)

# > anova(lm.1, lm.2)
# Analysis of Variance Table
# Model 1: Leg.3.1 ~ Head.W1
# Model 2: Leg.3.1 ~ Head.W1 + Site
  # Res.Df     RSS Df Sum of Sq     F    Pr(>F)    
# 1    302 1.25589                                 
# 2    297 0.91332  5   0.34257 22.28 < 2.2e-16 ***


# examining the multiple-intercepts model (lm.2)
summary(lm.2)
coef(lm.2)
confint(lm.2)

# extracting the intercepts
intercepts <- coef(lm.2)[c(1, 3:7)]
intercepts.1 <- intercepts[1]
intercepts <- intercepts.1 + intercepts
intercepts[1] <- intercepts.1
intercepts

# extracting the confidence intervals
ci <- confint(lm.2)[c(1, 3:7),]
ci[2:6,] <- ci[2:6,] + confint(lm.2)[1,]
ci[,1]

# putting everything together in a dataframe
labels <- c("ANZ", "BC", "DV", "MC", "RB", "WW")
ci.dataframe <- data.frame(Site=labels, Intercept=intercepts, CI.low = ci[,1], CI.high = ci[,2])
ci.dataframe

# plotting intercepts and 95% CI
qplot(Site, Intercept, geom=c("point", "errorbar"), ymin=CI.low, ymax=CI.high, data=ci.dataframe, ylab="Intercept & 95% CI")

ancova chặn

Tóm lại - vấn đề là 95% TCTD cho các lần chặn tất cả trùng lặp, nhưng phương pháp chọn mô hình cho thấy mô hình tốt nhất là mô hình phù hợp với các lần chặn khác nhau. Vì vậy, tôi có xu hướng nghĩ rằng phương pháp lựa chọn mô hình của chúng tôi là thiếu sót hoặc 95% TCTD cho các ước tính chặn được tính toán không chính xác. Bất kỳ suy nghĩ sẽ được đánh giá rất cao!

r regression anova confidence-interval

— James Waters
nguồn

1

Thuật ngữ thống kê của bạn bị nhầm lẫn. Bạn đang kết hợp nhóm có nghĩa là "chặn". Không thực sự là một vấn đề mã hóa. Đề xuất với người điều hành rằng nó sẽ được chuyển đến stats.exchange.

— DWin

11

Hãy nhớ rằng sự khác biệt giữa đáng kể và không đáng kể không (luôn luôn) có ý nghĩa thống kê

Bây giờ, nhiều hơn đến câu hỏi của bạn, mô hình 1 được gọi là hồi quy gộp và mô hình 2 hồi quy không phân nhánh. Như bạn đã lưu ý, trong hồi quy gộp, bạn cho rằng các nhóm không liên quan, điều đó có nghĩa là phương sai giữa các nhóm được đặt thành không.

Trong hồi quy không phân nhánh, với một nhóm chặn, bạn đặt phương sai thành vô cùng.

Nói chung, tôi thích một giải pháp trung gian, đó là mô hình phân cấp hoặc hồi quy gộp một phần (hoặc ước lượng co rút). Bạn có thể lắp mô hình này vào R với gói lmer4.

Cuối cùng, hãy xem bài viết này của Gelman , trong đó ông lập luận tại sao các mô hình phân cấp giúp giải quyết nhiều vấn đề so sánh (trong trường hợp của bạn, là các hệ số trên mỗi nhóm khác nhau? Làm thế nào để chúng ta sửa giá trị p cho nhiều so sánh).

Ví dụ, trong trường hợp của bạn,

library(lme4)
summary(lmer( leg ~ head + (1 | site)) # varying intercept model

Nếu bạn muốn lắp một độ dốc khác nhau, độ dốc khác nhau (kiểu thứ ba), chỉ cần chạy

summary(lmer( leg ~ head + (1 | site) + (0+head|site) )) # varying intercept, varying-slope model

Sau đó, bạn có thể xem phương sai của nhóm và xem nó có khác 0 không (hồi quy gộp không phải là mô hình tốt hơn) và khác xa với vô hạn (hồi quy không liên kết).

cập nhật: Sau khi nhận xét (xem bên dưới), tôi quyết định mở rộng câu trả lời của mình.

Mục đích của mô hình phân cấp, đặc biệt trong các trường hợp như thế này, là mô hình biến thể theo nhóm (trong trường hợp này là Trang web). Vì vậy, thay vì chạy ANOVA để kiểm tra xem một mô hình có khác với một mô hình khác hay không, tôi sẽ xem xét các dự đoán của mô hình của tôi và xem các dự đoán theo nhóm có tốt hơn trong các mô hình phân cấp so với hồi quy gộp (hồi quy cổ điển) .

Bây giờ, tôi đã chạy các đường của tôi ở trên và foudn rằng

ranef(lmer( leg ~ head + (1 | site) + (0+head|site) )

Sẽ trả về 0 khi ước tính độ dốc khác nhau (hiệu ứng khác nhau của đầu theo trang web). sau đó tôi chạy

ranef(lmer( leg ~ head + (head| site))

Và tôi đã có một ước tính khác không cho hiệu ứng khác nhau của đầu. Tôi vẫn chưa biết tại sao điều này lại xảy ra, vì đây là lần đầu tiên tôi tìm thấy thứ này. Tôi thực sự xin lỗi vì vấn đề này, nhưng, để bảo vệ tôi, tôi chỉ làm theo thông số kỹ thuật được nêu trong sự trợ giúp của chức năng lmer. (Xem ví dụ với trạng thái ngủ dữ liệu). Tôi sẽ cố gắng hiểu những gì đang xảy ra và tôi sẽ báo cáo ở đây khi (nếu) tôi hiểu những gì đang xảy ra.

— Manoel Galdino
nguồn

Cảm ơn @ manoel-galdino - Có đúng không khi kết luận từ những kết quả này vì phương sai liên quan đến Trang web ở đây không phải là sig. khác 0, thì yếu tố này không đáng kể trong mô hình?

Random effects:   Groups   Name        Variance  Std.Dev.   Site     (Intercept) 0.0019094 0.043697   Residual             0.0030755 0.055457

— James Waters

Ngoài ra @ manoel-galdino, bạn có thể giúp tôi diễn giải phần này của mô hình bằng tiếng Anh không? (0+head|site)

— James Waters

@JamesWaters, vâng, vì trang web không khác biệt đáng kể so với 0, nên sự khác biệt giữa các trang web không quan trọng.

— Manoel Galdino

(0 + head | site) sẽ mô hình hóa hiệu ứng của Head thay đổi theo trang web (độ dốc khác nhau). Tuy nhiên, tôi đã chạy nó và nó trả về số không. Tôi không biết tại sao. Nếu bạn chạy đơn giản reg <- lmer (Leg ~ Head + (Head | Site), data = mydata), bạn sẽ nhận được ước tính cho các hiệu ứng ngẫu nhiên. Sử dụng lệnh ranef (reg) để in các hiệu ứng ngẫu nhiên. Nhưng tôi sẽ mở rộng câu trả lời của mình ...

— Manoel Galdino

3

Trước bất kỳ sự can thiệp nào của người điều hành, bạn có thể xem xét

library(car)

crPlots(lm.2,terms=~Site)

Đây là các phần Thành phần + Phần dư (Phần dư)

một thành phần + lô dư

— BenBarnes
nguồn

Cảm ơn @BenBarnes, từ đây tôi có thể thấy rằng trang RB có mức chặn khá thấp so với BC. Có phải trường hợp so sánh này không phải khác biệt đáng kể để mô hình phù hợp với từng loại chặn này tốt hơn đáng kể so với mô hình phù hợp với một lần chặn?

— James Waters

@James, việc anova()so sánh lm.1với lm.2thực hiện phép thử F ( en.wikipedia.org/wiki/F-test#Regression_probols ), về cơ bản so sánh việc giảm tổng bình phương còn lại giữa hai mô hình lồng nhau với tổng bình phương còn lại của mô hình với nhiều điều khoản hơn. Do đó, nó không đặc biệt xem xét liệu các hệ số hồi quy riêng lẻ có ý nghĩa thống kê hay không. Giống như @Manoel, tôi thấy các bài báo và sách của Andrew Gelman rất hữu ích, đặc biệt là "Phân tích dữ liệu sử dụng mô hình hồi quy và phân cấp".

— BenBarnes

3

Tôi nghĩ, trong số những thứ khác, bạn đang tính sai khoảng tin cậy. Đây là hai cách để xem xét nó:

(1) sự khác biệt của từng trang web từ trang web cơ sở (ANZ) [bạn cũng có thể tính toán sự khác biệt từ giá trị trung bình tổng thể bằng cách thay đổi thành tương phản tổng bằng không

library(coefplot2)  ## on r-forge
coefplot2(lm.2)

hoặc (2) tất cả các so sánh theo cặp (Tôi không thích cách tiếp cận này, nhưng nó phổ biến):

library(multcomp)
ci <- confint(glht(lm.2, linfct = mcp(Site = "Tukey")))
ggplot(fortify(ci),aes(lhs,estimate,ymin=lwr,ymax=upr))+
    geom_pointrange()+theme_bw()+geom_hline(yintercept=0,col="red")

— Ben Bolker
nguồn

Cách tiếp cận gói multcomp đã đưa ra lỗi này:

Error in as.data.frame.default(x[[i]], optional = TRUE, stringsAsFactors = stringsAsFactors) :    cannot coerce class 'c("confint.glht", "glht")' into a data.frame

— James Waters

1

Lưu ý rằng tất cả các Headgiá trị của bạn nằm trong phạm vi 1.7 - 2.4, trong khi các phần chặn đang cố ước tính Leggiá trị tại Head=0. Đây là một phép ngoại suy chính, vì vậy có rất nhiều điều không chắc chắn. Nếu bạn tập trung vào các Headgiá trị và lặp lại phân tích này, khoảng tin cậy sẽ chặt chẽ hơn nhiều.

Ngoài ra, khoảng tin cậy 95% chồng chéo không có nghĩa là thiếu sự khác biệt có ý nghĩa thống kê. Trong thực tế, đối với hai nhóm, khoảng tin cậy 84% không chồng chéo gần đúng có sự khác biệt đáng kể ở mức 5%. Tất nhiên, vì nhiều thử nghiệm, điều này không hoàn toàn hoạt động với nhiều nhóm.

— Aniko
nguồn

1

Ngoài các câu trả lời khác, đây là một số liên kết từ Đơn vị tư vấn thống kê Cornell có liên quan đến các khoảng tin cậy chồng chéo và đóng vai trò là một lời nhắc ngắn, tốt về những gì họ làm và không có nghĩa

http://www.cscu.cornell.edu/news/statnews/stnews73.pdf http://www.cscu.cornell.edu/news/statnews/Stnews73insert.pdf

Đây là điểm chính:

Nếu hai thống kê có khoảng tin cậy không chồng chéo, chúng nhất thiết phải khác nhau đáng kể nhưng nếu chúng có khoảng tin cậy chồng chéo, thì không nhất thiết là chúng không khác nhau đáng kể.

Đây là văn bản có liên quan từ liên kết đầu tiên:

Chúng ta có thể minh họa điều này với một ví dụ đơn giản. Giả sử chúng ta quan tâm đến việc so sánh các phương tiện từ hai mẫu độc lập. Giá trị trung bình của mẫu thứ nhất là 9 và giá trị trung bình của mẫu thứ hai là 17. Giả sử rằng hai nhóm có nghĩa có cùng một lỗi tiêu chuẩn, bằng 2,5. Khoảng tin cậy 95 phần trăm cho trung bình nhóm đầu tiên có thể được tính là: ± × 5.296.19 trong đó 1.96 là giá trị t quan trọng. Do đó, khoảng tin cậy cho trung bình nhóm đầu tiên là (4.1, 13.9). Tương tự đối với nhóm thứ hai, khoảng tin cậy cho giá trị trung bình là (12.1, 21.9). Lưu ý rằng hai khoảng trùng nhau. Tuy nhiên, thống kê t để so sánh hai phương tiện là:
t = (17-9)/√(2.5² + 2.5²) = 2.26
phản ánh rằng giả thuyết khống, rằng phương tiện của hai nhóm là như nhau, nên bị loại bỏ ở mức α = 0,05. Để xác minh kết luận trên, hãy xem xét khoảng tin cậy 95 phần trăm cho sự khác biệt giữa hai nhóm có nghĩa là: (17-9) ± 1.96 x (2.5² + 2.5²) mang lại (1.09, 14.91). Khoảng không chứa 0, do đó chúng tôi bác bỏ giả thuyết null cho rằng nhóm có nghĩa là giống nhau.

Nói chung, khi so sánh hai ước tính tham số, luôn luôn đúng rằng nếu khoảng tin cậy không trùng nhau, thì số liệu thống kê sẽ khác nhau đáng kể về mặt thống kê. Tuy nhiên, điều ngược lại là không đúng sự thật. Đó là, sai lầm khi xác định ý nghĩa thống kê của sự khác biệt giữa hai thống kê dựa trên khoảng tin cậy chồng chéo. Để biết giải thích tại sao điều này đúng với trường hợp so sánh hai mẫu phương tiện, hãy xem liên kết sau: http://www.cscu.cornell.edu/news/statnews/Stnews73insert.pdf

Đây là thông tin từ liên kết khác:

nhập mô tả hình ảnh ở đây

— Jota
nguồn