Hãy tưởng tượng rằng bạn lặp lại một thí nghiệm ba lần. Trong mỗi thí nghiệm, bạn thu thập các phép đo ba lần. Các bộ ba có xu hướng khá gần nhau, so với sự khác biệt giữa ba phương tiện thử nghiệm. Tính toán có nghĩa là khá dễ dàng. Nhưng làm thế nào người ta có thể tính một khoảng tin cậy cho ý nghĩa lớn?
Dữ liệu mẫu:
Thí nghiệm 1: 34, 41, 39
Thí nghiệm 2: 45, 51, 52
Thí nghiệm 3: 29, 31, 35
Giả sử rằng các giá trị sao chép trong một thử nghiệm tuân theo phân phối Gaussian, cũng như các giá trị trung bình của từng thử nghiệm. SD của biến thể trong một thử nghiệm nhỏ hơn SD trong số các phương tiện thử nghiệm. Giả sử cũng không có thứ tự của ba giá trị trong mỗi thí nghiệm. Thứ tự từ trái sang phải của ba giá trị trong mỗi hàng là hoàn toàn tùy ý.
Cách tiếp cận đơn giản là trước tiên tính giá trị trung bình của từng thí nghiệm: 38.0, 49.3 và 31.7, sau đó tính giá trị trung bình và khoảng tin cậy 95% của ba giá trị đó. Sử dụng phương pháp này, giá trị trung bình lớn là 39,7 với khoảng tin cậy 95% nằm trong khoảng từ 17,4 đến 61,9.
Vấn đề với cách tiếp cận đó là nó hoàn toàn bỏ qua sự khác biệt giữa các bộ ba. Tôi tự hỏi nếu không có một cách tốt để giải thích cho sự thay đổi đó.