Tôi nghĩ đó là sự kết hợp của tất cả mọi thứ đã được nói. Đây là dữ liệu rất thú vị và tôi chưa từng nghĩ đến việc xem xét phân phối giá trị p như thế này trước đây. Nếu giả thuyết null là đúng, giá trị p sẽ đồng nhất. Nhưng tất nhiên với kết quả được công bố, chúng tôi sẽ không thấy sự đồng nhất vì nhiều lý do.
Chúng tôi thực hiện nghiên cứu vì chúng tôi hy vọng giả thuyết null là sai. Vì vậy, chúng ta sẽ nhận được kết quả quan trọng thường xuyên hơn không.
Nếu giả thuyết khống là sai chỉ bằng một nửa thời gian chúng ta sẽ không nhận được phân phối đồng nhất các giá trị p.
Sự cố ngăn kéo tệp: Như đã đề cập, chúng tôi sẽ ngại gửi giấy khi giá trị p không đáng kể, ví dụ dưới 0,05.
Các nhà xuất bản sẽ từ chối giấy vì kết quả không quan trọng mặc dù chúng tôi đã chọn gửi nó.
Khi kết quả ở trên đường biên giới, chúng tôi sẽ làm mọi thứ (có thể không với mục đích xấu) để có được ý nghĩa. (a) làm tròn xuống 0,05 khi giá trị p là 0,053, (b) tìm thấy các quan sát mà chúng tôi nghĩ có thể là ngoại lệ và sau khi di chuyển chúng, giá trị p giảm xuống dưới 0,05.
Tôi hy vọng điều này tóm tắt tất cả mọi thứ đã được nói một cách hợp lý dễ hiểu.
Những gì tôi nghĩ là quan tâm là chúng ta thấy giá trị p trong khoảng 0,05 đến 0,1. Nếu quy tắc xuất bản là từ chối bất cứ điều gì có giá trị p trên 0,05 thì đuôi bên phải sẽ bị cắt ở mức 0,05. Nó thực sự đã bị cắt ở 0.10? nếu vậy có thể một số tác giả và một số tạp chí sẽ chấp nhận mức ý nghĩa 0,10 nhưng không có gì cao hơn.
Vì nhiều bài viết bao gồm một số giá trị p (được điều chỉnh theo bội số hay không) và bài báo được chấp nhận vì các bài kiểm tra chính có ý nghĩa, chúng tôi có thể thấy các giá trị p không đáng kể có trong danh sách. Điều này đặt ra câu hỏi "Có phải tất cả các giá trị p được báo cáo trong bài báo được bao gồm trong biểu đồ không?"
Một quan sát bổ sung là có một xu hướng đáng kể về tần suất xuất bản của các bài báo được công bố khi giá trị p trở nên thấp hơn 0,05. Có lẽ đó là một dấu hiệu của các tác giả diễn giải quá mức suy nghĩ giá trị p p <0,0001 đáng để xuất bản hơn nhiều. Tôi nghĩ rằng tác giả bỏ qua hoặc không nhận ra rằng giá trị p phụ thuộc nhiều vào kích thước mẫu cũng như độ lớn của kích thước hiệu ứng.