Đây là một câu hỏi thảo luận về giao điểm của thống kê và các ngành khoa học khác. Tôi thường phải đối mặt với cùng một vấn đề: các nhà nghiên cứu trong lĩnh vực của tôi có xu hướng nói rằng không có tác dụng khi giá trị p không thấp hơn mức ý nghĩa. Ban đầu, tôi thường trả lời đây không phải là cách kiểm tra giả thuyết hoạt động. Với mức độ thường xuyên câu hỏi này phát sinh, tôi muốn thảo luận về vấn đề này với các nhà thống kê có kinh nghiệm hơn.
Chúng ta hãy xem xét một bài báo gần đây trên tạp chí khoa học của Tập đoàn xuất bản tốt nhất là Thiên nhiên Truyền thông Sinh học (có nhiều ví dụ, nhưng hãy tập trung vào một)
Các nhà nghiên cứu giải thích một kết quả không có ý nghĩa thống kê theo cách sau:
Do đó, hạn chế calo trung bình mãn tính có thể kéo dài tuổi thọ và tăng cường sức khỏe của linh trưởng, nhưng nó ảnh hưởng đến tính toàn vẹn của chất xám trong não mà không ảnh hưởng đến hiệu suất nhận thức .
Bằng chứng:
Tuy nhiên, các màn trình diễn trong nhiệm vụ mê cung Barnes không khác nhau giữa động vật bị kiểm soát và hạn chế calo (LME: F = 0,05, p = 0,82; Hình 2a). Tương tự, nhiệm vụ luân phiên tự phát không cho thấy bất kỳ sự khác biệt nào giữa động vật bị kiểm soát và hạn chế calo (LME: F = 1.63, p = 0.22; Hình 2b).
Các tác giả cũng đề xuất giải thích về sự vắng mặt của hiệu ứng - nhưng điểm quan trọng không phải là giải thích mà là chính yêu sách. Các lô được cung cấp trông khác biệt đáng kể "bằng mắt" đối với tôi (Hình 2).
Hơn nữa, các tác giả bỏ qua các kiến thức trước:
tác dụng phụ của hạn chế calo đối với hiệu suất nhận thức đã được báo cáo cho chuột và cho các chức năng não và cảm xúc ở người
Tôi có thể hiểu yêu cầu tương tự đối với các cỡ mẫu lớn (không có hiệu ứng = không có hiệu ứng thực tế đáng kể ở đó), nhưng trong trường hợp cụ thể, các thử nghiệm phức tạp đã được sử dụng và đối với tôi cách thực hiện tính toán công suất không rõ ràng.
Câu hỏi:
Tôi đã bỏ qua bất kỳ chi tiết nào làm cho kết luận của họ hợp lệ?
Có tính đến nhu cầu báo cáo kết quả tiêu cực trong khoa học, làm thế nào để chứng minh rằng đó không phải là "sự thiếu vắng kết quả" (mà chúng ta có với ), mà là "kết quả âm tính (ví dụ: không có sự khác biệt giữa các nhóm)" sử dụng số liệu thống kê? Tôi hiểu rằng đối với kích thước mẫu lớn, thậm chí độ lệch nhỏ so với từ chối null, nhưng hãy giả sử rằng chúng tôi có dữ liệu lý tưởng và vẫn cần chứng minh rằng null thực tế là đúng.
Các nhà thống kê có nên luôn nhấn mạnh vào các kết luận chính xác về mặt toán học như "có sức mạnh này mà chúng ta không thể phát hiện ra ảnh hưởng của kích thước đáng kể" không? Các nhà nghiên cứu từ các lĩnh vực khác không thích các công thức kết quả tiêu cực như vậy.
Tôi sẽ rất vui khi nghe bất kỳ suy nghĩ về vấn đề này và tôi đã đọc và hiểu các câu hỏi liên quan trên trang web này. Có một câu trả lời rõ ràng cho câu hỏi 2) -3) từ quan điểm thống kê, nhưng tôi muốn hiểu làm thế nào câu hỏi này phải được trả lời trong trường hợp đối thoại liên ngành.
CẬP NHẬT: Tôi nghĩ một ví dụ tốt về kết quả âm tính là giai đoạn 1 của thử nghiệm y tế, an toàn. Khi các nhà khoa học có thể quyết định rằng thuốc là an toàn? Tôi đoán họ so sánh hai nhóm và làm thống kê về dữ liệu này. Có cách nào để nói rằng thuốc này an toàn? Cochrane sử dụng chính xác "không tìm thấy tác dụng phụ", nhưng các bác sĩ nói rằng loại thuốc này an toàn. Khi sự cân bằng giữa độ chính xác và đơn giản của mô tả và chúng ta có thể nói "không có hậu quả cho sức khỏe"?