Câu trả lời:
Ý kiến của tôi là nó không (và nên) không phụ thuộc vào lĩnh vực nghiên cứu. Ví dụ, bạn có thể làm việc ở mức ý nghĩa thấp hơn nếu, ví dụ, nếu bạn đang cố gắng sao chép một nghiên cứu với kết quả lịch sử hoặc được thiết lập tốt (tôi có thể nghĩ về một số nghiên cứu về hiệu ứng Stroop , đã dẫn đầu đến một số tranh cãi trong vài năm qua). Đó là số tiền để xem xét "ngưỡng" thấp hơn trong khuôn khổ Neyman-Pearson cổ điển để kiểm tra giả thuyết. Tuy nhiên, ý nghĩa thống kê và thực tế (hoặc thực chất) là một vấn đề khác.
Sidenote . "Hệ sao" dường như đã thống trị các câu hỏi khoa học ngay từ những năm 70, nhưng hãy xem The Earth Is Round (p <.05), của J. Cohen ( Nhà tâm lý học người Mỹ , 1994, 49 (12), 997-1003), mặc dù thực tế là những gì chúng ta thường muốn biết được cung cấp dữ liệu tôi đã quan sát, xác suất mà là đúng là gì? Dù sao, cũng có một cuộc thảo luận thú vị về " Tại sao P = 0,05? ", Bởi Jerry Dallal.
Có thể hiếm khi ai đó sử dụng mức alpha được chỉ định trước thấp hơn 0,01, nhưng gần như không hiếm khi mọi người tuyên bố rằng alpha ngụ ý nhỏ hơn 0,01 trong niềm tin nhầm lẫn rằng giá trị P quan sát được nhỏ hơn 0,01 giống như Neyman-Pearson alpha nhỏ hơn 0,01.
Giá trị P của Fisher không giống hoặc có thể hoán đổi với tỷ lệ lỗi Neyman-Pearson. không có nghĩa là trừ khi người ta quyết định sử dụng làm mức độ quan trọng cho tầm quan trọng khi thử nghiệm được thiết kế. Nếu bạn đã lấy là đáng kể thì có nghĩa là có xác suất của yêu cầu dương tính giả.α = 0,0023 0,0023 P = 0,05 P = 0,0023 0,05
Có một cái nhìn tại Hubbard et al. Nhầm lẫn về các biện pháp chứng cứ (p)) so với lỗi (α's) trong kiểm tra thống kê cổ điển. Thống kê người Mỹ (2003) tập. 57 (3)
Tôi không quen thuộc lắm với tài liệu này nhưng tôi tin rằng một số nhà vật lý sử dụng ngưỡng thấp hơn nhiều trong các bài kiểm tra thống kê nhưng họ nói về nó một chút khác nhau. Ví dụ, nếu một số đo là ba độ lệch chuẩn so với dự đoán lý thuyết, thì nó được mô tả như là một độ lệch ba sigma. Về cơ bản, điều này có nghĩa là tham số quan tâm khác biệt về mặt thống kê với giá trị dự đoán trong thử nghiệm az với α = .01. Hai sigma gần tương đương với α = 0,05 (thực tế nó sẽ là 1,96). Nếu tôi không nhầm, mức độ lỗi tiêu chuẩn trong vật lý là 5 sigma, sẽ là α = 5 * 10 ^ -7
Ngoài ra, trong khoa học thần kinh hoặc dịch tễ học, dường như ngày càng phổ biến để thực hiện một số chỉnh sửa cho nhiều so sánh. Do đó, mức lỗi cho từng thử nghiệm riêng lẻ có thể thấp hơn p <.01
Như được lưu ý bởi Gaël Laurans trên các phân tích thống kê chạy vào vấn đề so sánh nhiều có xu hướng sử dụng các ngưỡng bảo thủ hơn. Tuy nhiên, về bản chất họ đang sử dụng 0,05, nhưng nhân với số lượng thử nghiệm. Rõ ràng là quy trình này (hiệu chỉnh Bonferroni) có thể nhanh chóng dẫn đến các giá trị p cực kỳ nhỏ. Đó là lý do tại sao mọi người trong quá khứ (trong khoa học thần kinh) dừng lại ở p <0,001. Ngày nay, các phương pháp khác của nhiều hiệu chỉnh so sánh được sử dụng (xem lý thuyết trường ngẫu nhiên Markov).