Tôi nghĩ rằng không có nhiều sai lầm khi nói rằng kết quả là "rất có ý nghĩa" (mặc dù có, nó hơi cẩu thả).
Điều đó có nghĩa rằng nếu bạn đã thiết lập một mức ý nghĩa nhỏ hơn nhiều , bạn vẫn sẽ có đánh giá kết quả như ý nghĩa. Hay tương đương, nếu một số độc giả của bạn có một nhỏ hơn nhiều α trong tâm trí, sau đó họ vẫn có thể đánh giá kết quả của bạn như đáng kể.αα
Lưu ý rằng mức ý nghĩa nằm trong mắt của kẻ si tình, trong khi giá trị p là (với một số cảnh báo) là một thuộc tính của dữ liệu.αp
Quan sát không giống như quan sát p = 0,04 , mặc dù cả hai có thể được gọi là "đáng kể" theo các quy ước tiêu chuẩn của lĩnh vực của bạn ( α = 0,05 ). Giá trị p nhỏ có nghĩa là bằng chứng mạnh mẽ hơn chống lại null (đối với những người thích thử nghiệm giả thuyết của Fisher); điều đó có nghĩa là khoảng tin cậy xung quanh kích thước hiệu ứng sẽ loại trừ giá trị null với biên độ lớn hơn (đối với những người thích TCTD hơn giá trị p ); nó có nghĩa là xác suất sau của null sẽ nhỏ hơn (đối với Bayes với một số trước); tất cả đều tương đương và đơn giản có nghĩa là những phát hiện này có sức thuyết phục hơnp=10−10p=0.04α=0.05pp. Xem giá trị p nhỏ hơn có thuyết phục hơn không? để thảo luận thêm.
Thuật ngữ "rất có ý nghĩa" là không chính xác và không cần phải có. Đó là một đánh giá chuyên môn chủ quan, tương tự như việc quan sát kích thước hiệu ứng lớn đáng ngạc nhiên và gọi nó là "rất lớn" (hoặc có lẽ đơn giản là "rất lớn"). Không có gì sai khi sử dụng các mô tả định tính, chủ quan về dữ liệu của bạn, ngay cả trong các bài viết khoa học; tất nhiên, với điều kiện là phân tích định lượng khách quan cũng được trình bày.
Xem thêm một số nhận xét xuất sắc ở trên, +1 cho @whuber, @Glen_b và @COOLSerdash.