Tôi đã có một cuộc thảo luận với một nhà thống kê hồi năm 2009, nơi ông nói rằng giá trị chính xác của giá trị p là không liên quan: điều duy nhất quan trọng là nó có ý nghĩa hay không. Tức là một kết quả không thể quan trọng hơn kết quả khác; ví dụ mẫu của bạn, đến từ cùng một dân số hoặc không.
Tôi có một số điều với điều này, nhưng có lẽ tôi có thể hiểu ý thức hệ:
Ngưỡng 5% là tùy ý, nghĩa là p = 0,051 không đáng kể và p = 0,049 là, không nên thực sự thay đổi kết luận về quan sát hoặc thử nghiệm của bạn, mặc dù một kết quả có ý nghĩa và kết quả khác không đáng kể.
Lý do tôi đưa ra điều này bây giờ là vì tôi đang học thạc sĩ về Tin sinh học, và sau khi nói chuyện với mọi người trong lĩnh vực này, dường như có một nỗ lực quyết tâm để có được giá trị p chính xác cho mỗi bộ thống kê họ làm. Chẳng hạn, nếu họ 'đạt được' giá trị p của p <1.9 × 10 -12 , họ muốn chứng minh kết quả của họ có ý nghĩa như thế nào và kết quả này là SIÊU thông tin. Vấn đề này được minh họa bằng các câu hỏi như: Tại sao tôi không thể có giá trị p nhỏ hơn 2.2e-16? , theo đó họ muốn ghi lại một giá trị chỉ ra rằng chỉ có cơ hội, đây sẽ là NHIỀU ít hơn 1 nghìn tỷ. Nhưng tôi thấy rất ít sự khác biệt trong việc chứng minh rằng kết quả này sẽ xảy ra ít hơn 1 phần nghìn tỷ so với 1 trong một tỷ.
Tôi có thể đánh giá cao rằng p <0,01 cho thấy có ít hơn 1% khả năng điều này sẽ xảy ra, trong khi p <0,001 chỉ ra rằng một kết quả như thế này thậm chí còn khó xảy ra hơn giá trị p đã nói ở trên, nhưng nếu kết luận của bạn được rút ra hoàn toàn khác nhau? Sau khi tất cả chúng đều là giá trị p đáng kể. Cách duy nhất tôi có thể hình dung là muốn ghi lại giá trị p chính xác là trong quá trình hiệu chỉnh Bonferroni, theo đó ngưỡng thay đổi do số lượng so sánh được thực hiện, do đó giảm lỗi loại I. Nhưng ngay cả khi vẫn còn, tại sao bạn muốn hiển thị giá trị p nhỏ hơn 12 bậc so với mức ý nghĩa ngưỡng của bạn?
Và không phải việc áp dụng hiệu chỉnh Bonferroni cũng hơi tùy tiện sao? Theo nghĩa ban đầu, sự hiệu chỉnh được xem là rất bảo thủ, và do đó, có những sự điều chỉnh khác mà người ta có thể chọn để truy cập mức ý nghĩa mà người quan sát có thể sử dụng cho nhiều so sánh của họ. Nhưng vì điều này, không phải là điểm mà một thứ gì đó trở nên quan trọng về cơ bản phụ thuộc vào số liệu thống kê mà nhà nghiên cứu muốn sử dụng. Số liệu thống kê nên được mở để giải thích?
Tóm lại, không nên thống kê ít chủ quan hơn (mặc dù tôi đoán rằng sự cần thiết phải chủ quan là hệ quả của một hệ thống đa biến), nhưng cuối cùng tôi muốn làm rõ một điều gì đó: có thể có gì quan trọng hơn điều gì khác không? Và p <0,001 có đủ để cố gắng ghi lại giá trị p chính xác không?