Nếu quan trọng của bạn nhỏ hơn những gì bạn đã tính toán và giả sử thử nghiệm phù hợp với loại dữ liệu cụ thể của bạn (một "nếu" quan trọng), có vẻ như sự khác biệt của bạn có ý nghĩa thống kê theo nghĩa . Một đáng kể trong bối cảnh thích hợp thường có nghĩa là sự khác biệt quan sát được của bạn quá đáng tin cậy khác không để hỗ trợ cho giả thuyết khống rằng dữ liệu hoàn toàn không "khác biệt". Ngay cả một sự khác biệt của có thể có ý nghĩa thống kê từ 0 nếu mọi khác biệt quan sát được nằm trong khoảng từ 0,00015, 0,00020. Quan sát!tunlikely to emerge at least as large in another, similar pair of samples selected randomly from the same populations if the null hypothesis of no difference is literally true of those populations
t17100,000
pop1=rep(15:20* .00001, 56);pop2=rep(0,336) #Some fake samples of sample size = 336
t.test(pop1,pop2,paired=T) #Paired t-test with the following output...
t(335)=187.55,p<2.2×10−16
Bởi vì các mẫu này rất khác nhau, sự khác biệt đạt được ý nghĩa thống kê, mặc dù chúng có quy mô nhỏ hơn so với nhiều người trong chúng ta thường thấy ở những con số trần tục, hàng ngày. Trên thực tế, bạn có thể thu nhỏ dữ liệu bao nhiêu tùy thích bằng cách xử lý nhiều số không như các phép tính của bạn có thể xử lý ở phía trước .00001
trong dòng mã R đầu tiên của tôi . Điều này sẽ giảm quy mô độ lệch chuẩn của sự khác biệt là tốt; tức là, sự khác biệt của bạn sẽ vẫn như nhau, của bạn sẽ vẫn giống hệt nhau, và ý nghĩa của nó cũng vậy.t
Có lẽ bạn sẽ quan tâm đến ý nghĩa thực tiễn hơn là theo nghĩa đen của thử nghiệm ý nghĩa giả thuyết null. Ý nghĩa thực tiễn sẽ phụ thuộc nhiều vào ý nghĩa của dữ liệu của bạn trong ngữ cảnh hơn là ý nghĩa thống kê; nó không phải là một vấn đề thống kê đơn thuần Tôi đã trích dẫn một ví dụ hữu ích về nguyên tắc này trong câu trả lời cho một câu hỏi phổ biến ở đây, chứa các quan điểm cố thủ của các giá trị p :
Người ta không thể kết luận bằng kích thước một mình rằng nhất thiết không quan trọng nếu nó có thể liên quan đến vấn đề sống và chết [(Rosenthal, Rubin, & Rosnow, 2000)] .r=.03
"Vấn đề sống và chết" này là kích thước tác dụng của aspirin đối với các cơn đau tim, về cơ bản - một ví dụ mạnh mẽ về sự khác biệt nhỏ về số lượng, ít nhất quán với ý nghĩa thực tế quan trọng. Nhiều câu hỏi khác với câu trả lời chắc chắn mà bạn có thể có lợi liên kết xứng đáng ở đây, bao gồm:
Tài liệu tham khảo
Rosenthal, R., Rosnow, RL, & Rubin, DB (2000). Sự tương phản và kích thước hiệu ứng trong nghiên cứu hành vi: Một cách tiếp cận tương quan . Nhà xuất bản Đại học Cambridge.