Bạn có thể sử dụng khoảng tin cậy (CI) để kiểm tra giả thuyết. Trong trường hợp điển hình, nếu CI cho hiệu ứng không kéo dài 0 thì bạn có thể từ chối giả thuyết null. Nhưng một CI có thể được sử dụng để biết thêm, trong khi báo cáo cho dù nó đã được thông qua là giới hạn về tính hữu ích của một bài kiểm tra.
Ví dụ, lý do bạn nên sử dụng CI thay vì chỉ kiểm tra t là vì sau đó bạn có thể làm nhiều hơn là chỉ kiểm tra các giả thuyết. Bạn có thể đưa ra tuyên bố về phạm vi hiệu ứng mà bạn tin là có thể xảy ra (những hiệu ứng trong CI). Bạn không thể làm điều đó chỉ với một bài kiểm tra t. Bạn cũng có thể sử dụng nó để đưa ra tuyên bố về null, điều mà bạn không thể làm với bài kiểm tra t. Nếu kiểm tra t không từ chối null thì bạn chỉ cần nói rằng bạn không thể từ chối null, điều đó không nói nhiều. Nhưng nếu bạn có khoảng tin cậy hẹp quanh null thì bạn có thể đề xuất rằng null hoặc giá trị gần với nó, có thể là giá trị thực và cho thấy hiệu quả của điều trị hoặc biến độc lập là quá nhỏ để có ý nghĩa ( hoặc rằng thí nghiệm của bạn không '
Đã thêm sau:
Tôi thực sự nên nói rằng, trong khi bạn có thể sử dụng CI như một bài kiểm tra thì nó không phải là một bài kiểm tra. Đó là ước tính của một phạm vi mà bạn nghĩ rằng các giá trị tham số nằm. Bạn có thể thực hiện bài kiểm tra như suy luận nhưng bạn tốt hơn hết là không bao giờ nói về nó theo cách đó.
Cái nào tốt hơn?
A) Hiệu ứng là 0,6, t (29) = 2,8, p <0,05. Hiệu ứng có ý nghĩa thống kê này là ... (một số cuộc thảo luận nảy sinh về ý nghĩa thống kê này mà không đề cập đến hoặc thậm chí khả năng mạnh mẽ để thảo luận về ý nghĩa thực tế của tầm quan trọng của phát hiện ... trong khuôn khổ Neyman-Pearson về độ lớn của t và p Giá trị khá vô nghĩa và tất cả những gì bạn có thể thảo luận là liệu hiệu ứng có hiện diện hay không được tìm thấy hiện diện. Bạn không bao giờ thực sự có thể nói về việc không thực sự có hiệu ứng dựa trên thử nghiệm.)
hoặc là
B) Sử dụng khoảng tin cậy 95%, tôi ước tính hiệu ứng nằm trong khoảng 0,2 đến 1,0. (một số cuộc thảo luận diễn ra khi nói về tác động thực sự của lợi ích, liệu các giá trị hợp lý của nó có phải là ý nghĩa cụ thể và bất kỳ việc sử dụng từ nào có ý nghĩa chính xác cho ý nghĩa của nó hay không. Ngoài ra, độ rộng của CI có thể trực tiếp đến một cuộc thảo luận về việc liệu đây là một phát hiện mạnh mẽ hay liệu bạn chỉ có thể đi đến một kết luận dự kiến hơn)
Nếu bạn đã tham gia một lớp thống kê cơ bản, ban đầu bạn có thể bị hút về A. Và có thể có một số trường hợp đó là cách tốt hơn để báo cáo kết quả. Nhưng đối với hầu hết các công việc B là xa và vượt trội. Một ước tính phạm vi không phải là một bài kiểm tra.