Ví dụ về các nghiên cứu sử dụng p <0,001, p <0,0001 hoặc thậm chí giá trị p thấp hơn?


11

Tôi đến từ các ngành khoa học xã hội, trong đó p <0,05 gần như là chuẩn mực, với p <0,1 và p <0,01 cũng xuất hiện, nhưng tôi đã tự hỏi: những lĩnh vực nghiên cứu nào, nếu có, sử dụng giá trị p thấp hơn làm phổ biến Tiêu chuẩn?

Câu trả lời:


9

Ý kiến ​​của tôi là nó không (và nên) không phụ thuộc vào lĩnh vực nghiên cứu. Ví dụ, bạn có thể làm việc ở mức ý nghĩa thấp hơn nếu, ví dụ, nếu bạn đang cố gắng sao chép một nghiên cứu với kết quả lịch sử hoặc được thiết lập tốt (tôi có thể nghĩ về một số nghiên cứu về hiệu ứng Stroop , đã dẫn đầu đến một số tranh cãi trong vài năm qua). Đó là số tiền để xem xét "ngưỡng" thấp hơn trong khuôn khổ Neyman-Pearson cổ điển để kiểm tra giả thuyết. Tuy nhiên, ý nghĩa thống kê và thực tế (hoặc thực chất) là một vấn đề khác.p<0.001

Sidenote . "Hệ sao" dường như đã thống trị các câu hỏi khoa học ngay từ những năm 70, nhưng hãy xem The Earth Is Round (p <.05), của J. Cohen ( Nhà tâm lý học người Mỹ , 1994, 49 (12), 997-1003), mặc dù thực tế là những gì chúng ta thường muốn biết được cung cấp dữ liệu tôi đã quan sát, xác suất mà là đúng là gì? Dù sao, cũng có một cuộc thảo luận thú vị về " Tại sao P = 0,05? ", Bởi Jerry Dallal.H0


Vui lòng sửa lỗi suy nghĩ của tôi: một số lĩnh vực có thể tập trung vào, giả sử, phơi nhiễm sinh hóa và do đó muốn sử dụng p <0,001 để ngăn ngừa bất kỳ lỗi Loại I nào có thể dẫn đến nguy hiểm cho sức khỏe. Ngoài ra, cùng với bài viết này từ Am Psych , tôi cũng nhớ một nghiên cứu tuyệt vời trong Am J của Sociol hoặc một trong những tạp chí soc sci mà tôi theo dõi. Tất nhiên, yêu thích của tôi là Ziliak và McCloskey .
Cha

1
Những gì bạn mô tả ở đây âm thanh ngược. Tôi lo lắng về lỗi Loại II, nói rằng có gì đó không có khi tiếp xúc với sinh hóa. Trong trường hợp đó tôi có thể đặt alpha cao hơn, không thấp hơn.
John

Tôi đã làm việc với giả định rằng xét nghiệm sẽ có dạng: "Hãy đánh giá xem việc mang thai có liên quan đến HRT không" (trong trường hợp đó, lỗi Loại I nghiêm trọng hơn lỗi Loại II, nhưng có lẽ thiết kế này không đạt tiêu chuẩn).
Cha

7

Có thể hiếm khi ai đó sử dụng mức alpha được chỉ định trước thấp hơn 0,01, nhưng gần như không hiếm khi mọi người tuyên bố rằng alpha ngụ ý nhỏ hơn 0,01 trong niềm tin nhầm lẫn rằng giá trị P quan sát được nhỏ hơn 0,01 giống như Neyman-Pearson alpha nhỏ hơn 0,01.

Giá trị P của Fisher không giống hoặc có thể hoán đổi với tỷ lệ lỗi Neyman-Pearson. không có nghĩa là trừ khi người ta quyết định sử dụng làm mức độ quan trọng cho tầm quan trọng khi thử nghiệm được thiết kế. Nếu bạn đã lấy là đáng kể thì có nghĩa là có xác suất của yêu cầu dương tính giả.α = 0,0023 0,0023 P = 0,05 P = 0,0023 0,05P=0.0023α=0.00230.0023P=0.05P=0.00230.05

Có một cái nhìn tại Hubbard et al. Nhầm lẫn về các biện pháp chứng cứ (p)) so với lỗi (α's) trong kiểm tra thống kê cổ điển. Thống kê người Mỹ (2003) tập. 57 (3)


Tôi hiểu sự khác biệt, mặc dù tôi có thể thường xuyên mắc lỗi. Nhưng câu hỏi của tôi là, có cách sử dụng thông thường nào, ở đâu đó ngoài kia, của p <.0001 chẳng hạn? Hoặc, để đặt nó một cách khiêu khích, là p <.05 giáo phái phổ quát?
Cha

'Sùng bái' P <0,05 có thể gần như phổ biến, nhưng không thể tự tin về bất kỳ khẳng định nào về điểm này vì các trường hợp ngoại lệ rõ ràng rất có thể là kết quả của việc không biết phương pháp lai giữa Fisher và Neyman-Pearson. Trong các tài liệu nghiên cứu dược lý cơ bản hầu như không bao giờ có tuyên bố rõ ràng về việc sử dụng tỷ lệ lỗi Neyman-Pearson.
Michael Lew

Cảm ơn ví dụ. Tôi ngày càng ít gây ấn tượng bởi các nghiên cứu dược lý, đối với nhiều (không phải tất cả khoa học) lý do ...
Fr.

1
Bạn không nên nhận xét của tôi về nghiên cứu dược lý cơ bản như một lời chỉ trích cụ thể về lĩnh vực đó, nó chỉ là ngành học riêng của tôi và do đó tôi là người có kinh nghiệm nhất. Tôi tin tưởng rằng bạn sẽ tìm thấy nhiều lĩnh vực trong nghiên cứu cơ bản với những thiếu sót chính xác tương tự đối với các giá trị P và tỷ lệ lỗi lai.
Michael Lew

Không phải lo lắng, tôi có thể dễ dàng tưởng tượng rằng thiếu sót này đi tốt trên các lĩnh vực điều tra.
Cha

3

Tôi không quen thuộc lắm với tài liệu này nhưng tôi tin rằng một số nhà vật lý sử dụng ngưỡng thấp hơn nhiều trong các bài kiểm tra thống kê nhưng họ nói về nó một chút khác nhau. Ví dụ, nếu một số đo là ba độ lệch chuẩn so với dự đoán lý thuyết, thì nó được mô tả như là một độ lệch ba sigma. Về cơ bản, điều này có nghĩa là tham số quan tâm khác biệt về mặt thống kê với giá trị dự đoán trong thử nghiệm az với α = .01. Hai sigma gần tương đương với α = 0,05 (thực tế nó sẽ là 1,96). Nếu tôi không nhầm, mức độ lỗi tiêu chuẩn trong vật lý là 5 sigma, sẽ là α = 5 * 10 ^ -7

Ngoài ra, trong khoa học thần kinh hoặc dịch tễ học, dường như ngày càng phổ biến để thực hiện một số chỉnh sửa cho nhiều so sánh. Do đó, mức lỗi cho từng thử nghiệm riêng lẻ có thể thấp hơn p <.01


1
Dịch tễ học di truyền thường xuyên sử dụng trong các nghiên cứu về genomewide, thường bất kể số lượng xét nghiệm chính xác được thực hiện. α=5×108
khách

1

Như được lưu ý bởi Gaël Laurans trên các phân tích thống kê chạy vào vấn đề so sánh nhiều có xu hướng sử dụng các ngưỡng bảo thủ hơn. Tuy nhiên, về bản chất họ đang sử dụng 0,05, nhưng nhân với số lượng thử nghiệm. Rõ ràng là quy trình này (hiệu chỉnh Bonferroni) có thể nhanh chóng dẫn đến các giá trị p cực kỳ nhỏ. Đó là lý do tại sao mọi người trong quá khứ (trong khoa học thần kinh) dừng lại ở p <0,001. Ngày nay, các phương pháp khác của nhiều hiệu chỉnh so sánh được sử dụng (xem lý thuyết trường ngẫu nhiên Markov).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.