Ý nghĩa của năng lượng thấp trong khoa học thần kinh sau khi kết hợp kết quả của nhiều phân tích tổng hợp (Nút et al 2013)


7

Trong một bài viết đánh giá năm 2013 trên tạp chí Nature Neuroscience, Button et al. Mất điện: tại sao cỡ mẫu nhỏ làm giảm độ tin cậy của khoa học thần kinh , nó đã được tuyên bố rằng:

sức mạnh thống kê trung bình của các nghiên cứu trong khoa học thần kinh là rất thấp

Họ đã tìm kiếm các phân tích tổng hợp, tính toán sức mạnh hậu hoc trong mỗi một trong số họ, và kết hợp các kết quả bằng cách lấy sức mạnh hậu trung bình. Trung vị là 20%. Tôi chỉ không nhận được nó. Sức mạnh hậu hoc luôn gắn liền với các giá trị p đạt được. Nó không giống như viết rằng giá trị p trung bình là khoảng ~ 0,3 tương ứng với sức mạnh sau hoc 20%?

Vì vậy, về cơ bản làm thế nào kết quả này làm suy yếu chất lượng nghiên cứu trong khoa học thần kinh? Có vẻ như họ đã xuất bản các nghiên cứu với rất nhiều giá trị p không đáng kể.

Đánh giá này là một nghiên cứu khoa học thần kinh tự nhiên với các tác giả rất nổi tiếng, vì vậy tôi nghĩ rằng sự giải thích của tôi có nhiều khả năng thiếu sót.

EDIT: Tôi sẽ thấy một số điểm nếu chúng chỉ bao gồm các nghiên cứu có ý nghĩa danh nghĩa. Trong trường hợp đó, sức mạnh trung bình sẽ cho biết xác suất sao chép trung bình của những phát hiện quan trọng.


1
Sức mạnh bài hoc là vô nghĩa và sai lệch. Xem Hoenig & Heisey (2001, Nhà thống kê người Mỹ ) . "Đó là một nghiên cứu tự nhiên với các tác giả rất nổi tiếng, vì vậy tôi nghĩ rằng cách giải thích của tôi có nhiều khả năng thiếu sót." - đây là một kết luận sai. Tự nhiên , Khoa học và các tạp chí tương tự chọn cho những phát hiện đáng ngạc nhiên, không phải cho số liệu thống kê hợp lệ. Thật không may, những người đánh giá ở đây thường không biết nhiều số liệu thống kê hơn những người trong các tạp chí xếp hạng thấp hơn.
Stephan Kolassa

1
Tôi đồng ý rằng phân tích sức mạnh bài hoc của một nghiên cứu là vô nghĩa và sai lệch. Tuy nhiên, tôi nghĩ rằng việc đưa ra tuyên bố về mức độ sức mạnh điển hình của một lĩnh vực nghiên cứu là rất có ý nghĩa, vì điều này không gắn liền với kết quả nghiên cứu cụ thể ở cấp độ diễn giải. Tuy nhiên, các giả định của việc làm như vậy có thể gây nghi ngờ nếu phân tích tổng hợp có kết quả không đồng nhất, như thường thấy.
dbwilson

1
@StephanKolassa Tôi đồng ý rằng có thể có rác được xuất bản trên tạp chí Tự nhiên hoặc Khoa học, nhưng tôi thấy nhận xét của bạn có phần không hữu ích trừ khi bạn quen thuộc với nghiên cứu cụ thể này. Trên thực tế, IMHO là một bài báo hay và họ không làm được quyền lực, vì vậy sự hiểu biết của OP thực sự là thiếu sót. Câu trả lời của dbwilson dường như giải thích điều này một cách chính xác (+1).
amip

Có vẻ như giá trị thấp của p đang bị hiểu sai là không đáng kể. Do đó rất khó để trả lời câu hỏi. Sự nhầm lẫn hơn nữa được gây ra bằng cách giới thiệu ý tưởng về trung vị trong quan điểm này. Câu hỏi có thể được cải thiện bằng cách xác định các khái niệm nhất định.
Subhash C. Davar

Câu trả lời:


6

Tôi không quen thuộc với nghiên cứu cụ thể này nhưng quen thuộc với việc ước tính sức mạnh của một lĩnh vực nghiên cứu sử dụng phân tích tổng hợp. Câu nói của bạn rằng "sức mạnh bài hoc luôn gắn liền với giá trị p đạt được" gợi ý cho tôi rằng bạn giả định rằng sức mạnh bài hoc cho mỗi nghiên cứu riêng lẻ đóng góp vào một phân tích tổng hợp duy nhất dựa trên giả định rằng hiệu ứng quan sát được bằng hiệu ứng dân số thực sự. Chỉ với giả định đó, sức mạnh bài hoc sẽ liên quan đến giá trị p (cá nhân tôi thấy hình thức phân tích sức mạnh bài hoc này là vô nghĩa, nhưng đó là một chủ đề hơi lạc hậu).

Những gì tôi tin rằng các tác giả của bài báo này đang làm, cho rằng đó là những gì thường được thực hiện, là giả định rằng ý nghĩa phân tích tổng hợp là hiệu ứng dân số thực sự và ước tính sức mạnh cho các nghiên cứu đóng góp vào giá trị đó, chứ không phải hiệu quả quan sát của mỗi nghiên cứu. Do đó, công suất trung bình trong phân tích tổng hợp là một hàm của hiệu ứng trung bình tổng phân tích tổng thể và kích thước mẫu (hoặc sai số chuẩn) của từng nghiên cứu. Họ đã làm điều này cho mỗi phân tích tổng hợp và tính toán sức mạnh trung bình trên chúng.


1
Vì tò mò tôi đã đọc lướt qua bài báo và họ sử dụng G * Power , người mà các tác giả rõ ràng không thích các phân tích "sức mạnh hồi cứu" . (Ít nhất là trong bài báo Faul et al. 2007 được liên kết từ trang web của họ; Tôi chưa sử dụng phần mềm.)
GeoMatt22

+1. Tôi biết Nút et al. 2013, sử dụng nó trong giảng dạy, và tôi tin rằng đây là câu trả lời chính xác. Cc đến @ GeoMatt22. Nếu bạn có một nghiên cứu với n = 10 và một nghiên cứu khác với n = 1000 và nghiên cứu lớn cho thấy hiệu quả rất nhỏ, thì việc thực hiện "phân tích tổng hợp" là hoàn toàn tốt, kết luận rằng hiệu quả thực sự có thể nhỏ ( dựa trên nghiên cứu lớn) và kết luận thêm rằng nghiên cứu nhỏ phải có công suất rất thấp - ngay cả khi nó báo cáo giá trị p đáng kể và kích thước hiệu ứng lớn. Tôi không biết tại sao mọi người sẽ từ chối điều đó.
amip

@amoeba Tôi không quen thuộc với lĩnh vực này và tôi hy vọng nhận xét của mình không bị sai: Nó nhằm hỗ trợ đoạn 1 của câu trả lời, tức là phần mềm mà các tác giả đã sử dụng hỗ trợ phân tích hậu hoc, nhưng không phân tích hồi cứu. Và cái mà OP gọi là " post hoc " có thể là cái thường được gọi là " hồi cứu ". (Nhưng một lần nữa, tôi không quen thuộc với lĩnh vực này.)
GeoMatt22
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.