Tôi chỉ đọc trên một tạp chí khoa học khá phổ biến (phổ biến) (Thủ tướng Đức, 02/2013, tr.36) về một thí nghiệm thú vị (không có nguồn, thật không may). Nó thu hút sự chú ý của tôi bởi vì bằng trực giác tôi đã nghi ngờ về tầm quan trọng của kết quả, nhưng thông tin được cung cấp là đủ để tái tạo thử nghiệm thống kê.
Các nhà nghiên cứu tự hỏi liệu việc bị lạnh trong thời tiết lạnh có làm tăng tỷ lệ mắc cảm lạnh hay không. Vì vậy, họ ngẫu nhiên chia một nhóm 180 sinh viên thành hai nhóm. Một nhóm phải giữ chân họ trong nước lạnh trong 20 phút. Người kia giữ giày của họ trên. Một kiểu thao túng buồn cười, tôi nghĩ vậy, nhưng mặt khác tôi không phải là bác sĩ và có lẽ bác sĩ nghĩ buồn cười. Vấn đề đạo đức sang một bên.
Dù sao, sau 5 ngày, 13 học sinh trong nhóm điều trị bị cảm, nhưng chỉ có 5 người trong nhóm giữ giày. Tỷ lệ cược của thí nghiệm này là 2,87.
Với kích thước mẫu khá nhỏ, tôi bắt đầu tự hỏi liệu sự khác biệt này có thể là đáng kể. Vì vậy, tôi đã tiến hành hai bài kiểm tra.
Đầu tiên một bài kiểm tra đơn giản về sự bằng nhau của tỷ lệ bằng cách sử dụng xấp xỉ bình thường. Bài kiểm tra này có với . Tôi đoán rằng đây là những gì các nhà nghiên cứu đã thử nghiệm. Đây thực sự chỉ là đáng kể. Tuy nhiên, kiểm tra z này chỉ có giá trị trong các mẫu lớn, nếu tôi không nhầm, do xấp xỉ bình thường. Hơn nữa, tỷ lệ lưu hành khá nhỏ và tôi tự hỏi liệu điều này có thể không ảnh hưởng đến tỷ lệ bao phủ của khoảng tin cậy của hiệu ứng.
Vì vậy, lần thử thứ hai của tôi là một thử nghiệm độc lập chi bình phương, cả với mô phỏng Monte-Carlo và Pearson Chi-vuông tiêu chuẩn. Ở đây tôi tìm thấy giá trị cả về .
Bây giờ tất cả không quá yên tâm về kết quả. Tôi tự hỏi liệu có nhiều lựa chọn hơn để kiểm tra dữ liệu này không và suy nghĩ của bạn về hai bài kiểm tra là gì (đặc biệt là các giả định của bài kiểm tra đầu tiên, quan trọng,)