Wikipedia nói
Các phương pháp dựa trên thử nghiệm omnibus trước khi tiến hành nhiều so sánh . Thông thường, các phương pháp này yêu cầu thử nghiệm phạm vi ANOVA / Tukey đáng kể trước khi tiến hành nhiều so sánh. Các phương thức này có kiểm soát "yếu" lỗi Loại I.
Thử nghiệm F trong ANOVA là một ví dụ về thử nghiệm omnibus, thử nghiệm tầm quan trọng tổng thể của mô hình. Thử nghiệm F đáng kể có nghĩa là trong số các phương tiện được thử nghiệm, ít nhất hai trong số các phương tiện khác nhau đáng kể, nhưng kết quả này không xác định chính xác phương tiện nào khác với phương tiện khác. Trên thực tế, kiểm tra có nghĩa là 'sự khác biệt đã được thực hiện bởi thống kê F hợp lý bậc hai (F = MSB / MSW). Để xác định nghĩa trung bình nào khác với trung bình khác hoặc độ tương phản của phương tiện khác nhau đáng kể, các bài kiểm tra Post Hoc (Nhiều bài kiểm tra so sánh) hoặc các bài kiểm tra theo kế hoạch nên được tiến hành sau khi có được bài kiểm tra F omnibus F đáng kể. Có thể cân nhắc sử dụng hiệu chỉnh Bonferroni đơn giản hoặc hiệu chỉnh phù hợp khác.
Vì vậy, một thử nghiệm omnibus được sử dụng để kiểm tra tầm quan trọng tổng thể, trong khi nhiều so sánh là để tìm ra sự khác biệt nào là đáng kể.
Nhưng nếu tôi hiểu chính xác, mục đích chính của so sánh nhiều là để kiểm tra ý nghĩa tổng thể, và nó cũng có thể tìm thấy sự khác biệt nào là đáng kể. Nói cách khác, nhiều so sánh có thể làm những gì một loài ăn tạp có thể làm. Vậy thì tại sao chúng ta cần một bài kiểm tra omnibus?