Mối quan tâm của bạn chính xác là mối quan tâm làm cơ sở cho rất nhiều cuộc thảo luận hiện tại trong khoa học về khả năng tái sản xuất. Tuy nhiên, tình trạng thực sự phức tạp hơn một chút so với bạn đề xuất.
Đầu tiên, hãy thiết lập một số thuật ngữ. Kiểm tra ý nghĩa giả thuyết Null có thể được hiểu là một vấn đề phát hiện tín hiệu - giả thuyết null là đúng hoặc sai và bạn có thể chọn từ chối hoặc giữ lại nó. Sự kết hợp của hai quyết định và hai trạng thái "thực tế" có thể dẫn đến kết quả trong bảng sau đây, mà hầu hết mọi người đều thấy tại một số điểm khi lần đầu tiên học thống kê:
Các nhà khoa học sử dụng thử nghiệm ý nghĩa giả thuyết null đang cố gắng tối đa hóa số lượng quyết định chính xác (hiển thị màu xanh lam) và giảm thiểu số lượng quyết định không chính xác (hiển thị màu đỏ). Các nhà khoa học làm việc cũng đang cố gắng công bố kết quả của họ để họ có thể có được việc làm và thăng tiến trong sự nghiệp.
Tất nhiên, hãy nhớ rằng, như nhiều người trả lời khác đã đề cập, giả thuyết null không được chọn ngẫu nhiên - thay vào đó, nó thường được chọn cụ thể bởi vì, dựa trên lý thuyết trước đó, nhà khoa học tin rằng nó là sai . Thật không may, thật khó để định lượng tỷ lệ các lần mà các nhà khoa học đúng trong dự đoán của họ, nhưng hãy nhớ rằng, khi các nhà khoa học đang xử lý cột " là sai", họ nên lo lắng về âm tính giả thay vì dương tính giả.H0
Tuy nhiên, bạn dường như lo ngại về các kết quả dương tính giả, vì vậy hãy tập trung vào cột " là đúng". Trong tình huống này, xác suất của một nhà khoa học công bố một kết quả sai là gì?H0
Sai lệch xuất bản
Miễn là xác suất xuất bản không phụ thuộc vào việc kết quả có "đáng kể" hay không, thì xác suất đó chính xác là - 0,05 và đôi khi thấp hơn tùy thuộc vào trường. Vấn đề là có bằng chứng tốt cho thấy xác suất xuất bản không phụ thuộc vào kết quả có đáng kể hay không (xem, ví dụ, Stern & Simes, 1997 ; Dwan et al., 2008 ), bởi vì các nhà khoa học chỉ gửi kết quả quan trọng cho xuất bản (vấn đề được gọi là ngăn kéo tệp; Rosenthal, 1979 ) hoặc do các kết quả không quan trọng được gửi để xuất bản nhưng không được thực hiện thông qua đánh giá ngang hàng.α
Vấn đề chung về xác suất xuất bản tùy thuộc vào giá trị được quan sát là ý nghĩa của xu hướng xuất bản . Nếu chúng ta lùi lại một bước và suy nghĩ về ý nghĩa của xu hướng xuất bản đối với tài liệu nghiên cứu rộng hơn, một tài liệu nghiên cứu bị ảnh hưởng bởi xu hướng xuất bản sẽ vẫn chứa kết quả đúng - đôi khi giả thuyết khống cho rằng một nhà khoa học tuyên bố là sai thực sự sẽ là sai, và, tùy thuộc vào mức độ sai lệch xuất bản, đôi khi một nhà khoa học sẽ tuyên bố chính xác rằng một giả thuyết null đã cho là đúng. Tuy nhiên, tài liệu nghiên cứu cũng sẽ bị xáo trộn bởi tỷ lệ dương tính giả quá lớn (nghĩa là các nghiên cứu trong đó nhà nghiên cứu cho rằng giả thuyết khống là sai khi thực sự đúng).p
Nhà nghiên cứu mức độ tự do
Xu hướng xuất bản không phải là cách duy nhất mà theo giả thuyết khống, xác suất công bố kết quả quan trọng sẽ lớn hơn . Khi được sử dụng không đúng cách, một số lĩnh vực linh hoạt nhất định trong thiết kế nghiên cứu và phân tích dữ liệu, đôi khi được gắn nhãn mức độ tự do của nhà nghiên cứu ( Simmons, Nelson, & Simonsohn, 2011 ), có thể làm tăng tỷ lệ dương tính giả, ngay cả khi không có sai lệch xuất bản. Ví dụ: nếu chúng tôi cho rằng, khi đạt được kết quả không đáng kể, tất cả (hoặc một số) nhà khoa học sẽ loại trừ một điểm dữ liệu ngoại vi nếu loại trừ này sẽ thay đổi kết quả không đáng kể thành kết quả quan trọng, tỷ lệ dương tính giả sẽ là lớn hơnalphaαα. Với sự hiện diện của một số lượng lớn các thực tiễn nghiên cứu đáng ngờ, tỷ lệ dương tính giả có thể lên tới 0,5% ngay cả khi tỷ lệ danh nghĩa được đặt ở 0,05 ( Simmons, Nelson, & Simonsohn, 2011 ).
Điều quan trọng cần lưu ý là việc sử dụng không đúng mức độ tự do của nhà nghiên cứu (đôi khi được gọi là thực tiễn nghiên cứu đáng ngờ; Martinson, Anderson, & de Vries, 2005 ) không giống như tạo dữ liệu. Trong một số trường hợp, loại trừ các ngoại lệ là điều nên làm, vì thiết bị không thành công hoặc vì một số lý do khác. Vấn đề chính là, với sự hiện diện của mức độ tự do của nhà nghiên cứu, các quyết định được đưa ra trong quá trình phân tích thường phụ thuộc vào cách dữ liệu bật ra ( Gelman & Loken, 2014), ngay cả khi các nhà nghiên cứu trong câu hỏi không nhận thức được thực tế này. Chừng nào các nhà nghiên cứu sử dụng mức độ tự do của nhà nghiên cứu (một cách có ý thức hoặc vô thức) để tăng xác suất của một kết quả quan trọng (có lẽ vì kết quả quan trọng là "có thể xuất bản" hơn), sự hiện diện của mức độ tự do của nhà nghiên cứu sẽ vượt quá một tài liệu nghiên cứu với sự tích cực sai trong cùng một cách như thiên vị xuất bản.
Một cảnh báo quan trọng cho các cuộc thảo luận ở trên là các bài báo khoa học (ít nhất là trong tâm lý học, đó là lĩnh vực của tôi) hiếm khi bao gồm các kết quả duy nhất. Phổ biến hơn là nhiều nghiên cứu, mỗi nghiên cứu bao gồm nhiều thử nghiệm - trọng tâm là xây dựng một lập luận lớn hơn và loại trừ những giải thích thay thế cho bằng chứng được trình bày. Tuy nhiên, việc trình bày có chọn lọc các kết quả (hoặc sự hiện diện của mức độ tự do của nhà nghiên cứu) có thể tạo ra sự thiên vị trong một tập hợp kết quả dễ dàng như một kết quả duy nhất. Có bằng chứng cho thấy các kết quả được trình bày trong các bài báo đa nghiên cứu thường sạch sẽ và mạnh mẽ hơn nhiều so với mong đợi ngay cả khi tất cả các dự đoán của các nghiên cứu này đều đúng ( Francis, 2013 ).
Phần kết luận
Về cơ bản, tôi đồng ý với trực giác của bạn rằng thử nghiệm ý nghĩa giả thuyết null có thể sai. Tuy nhiên, tôi sẽ lập luận rằng thủ phạm thực sự tạo ra tỷ lệ dương tính giả cao là các quá trình như sai lệch xuất bản và sự hiện diện của mức độ tự do của nhà nghiên cứu. Thật vậy, nhiều nhà khoa học nhận thức rõ về những vấn đề này và cải thiện khả năng tái sản xuất khoa học là một chủ đề thảo luận rất tích cực hiện nay (ví dụ, Nosek & Bar-Anan, 2012 ; Nosek, Spies, & Motyl, 2012 ). Vì vậy, bạn đang ở trong công ty tốt với mối quan tâm của bạn, nhưng tôi cũng nghĩ rằng cũng có những lý do cho một số lạc quan thận trọng.
Người giới thiệu
Stern, JM, & Simes, RJ (1997). Xu hướng xuất bản: Bằng chứng về việc xuất bản bị trì hoãn trong một nghiên cứu đoàn hệ các dự án nghiên cứu lâm sàng. BMJ, 315 (7109), 640 Tiếng645. http://doi.org/10.1136/bmj.315.7109.640
Dwan, K., Altman, DG, Arnaiz, JA, Bloom, J., Chan, A., Cronin, E., Tiết Williamson, PR (2008). Đánh giá có hệ thống các bằng chứng thực nghiệm về xu hướng xuất bản nghiên cứu và sai lệch báo cáo kết quả. PLoS MỘT, 3 (8), e3081. http://doi.org/10.1371/journal.pone.0003081
Rosenthal, R. (1979). Các vấn đề ngăn kéo tập tin và dung sai cho kết quả null. Bản tin tâm lý, 86 (3), 638 trừ641. http://doi.org/10.1037/0033-2909.86.3.638
Simmons, JP, Nelson, LD, & Simonsohn, Hoa Kỳ (2011). Tâm lý dương tính giả: Tính linh hoạt không được tiết lộ trong thu thập và phân tích dữ liệu cho phép trình bày bất cứ điều gì quan trọng. Khoa học tâm lý, 22 (11), 1359 Từ1366. http://doi.org/10.1177/0956797611417632
Martinson, BC, Anderson, MS, & de Vries, R. (2005). Các nhà khoa học hành xử xấu. Thiên nhiên, 435, 737 Điện738. http://doi.org/10.1038/435737a
Gelman, A., & Loken, E. (2014). Cuộc khủng hoảng thống kê trong khoa học. Nhà khoa học Mỹ, 102, 460-465.
Đức Phanxicô, G. (2013). Nhân rộng, thống nhất thống kê và thiên vị xuất bản. Tạp chí Tâm lý học toán học, 57 (5), 153 Từ169. http://doi.org/10.1016/j.jmp.2013.02.003
Mũi, BA, & Bar-Anan, Y. (2012). Khoa học không tưởng: I. Mở giao tiếp khoa học. Điều tra tâm lý, 23 (3), 217 Từ243. http://doi.org/10.1080/1047840X.2012,692215
Mũi, BA, Điệp viên, JR, & Motyl, M. (2012). Khoa học không tưởng: II. Tái cơ cấu khuyến khích và thực hành để thúc đẩy sự thật về khả năng xuất bản. Quan điểm về khoa học tâm lý, 7 (6), 615 trận631. http://doi.org/10.1177/1745691612459058