Tại sao việc tìm kiếm các hiệu ứng nhỏ trong các nghiên cứu lớn chỉ ra sự thiên vị xuất bản?


32

Một số bài báo phương pháp luận (ví dụ Egger et al 1997a, 1997b) thảo luận về xu hướng xuất bản như được tiết lộ bởi các phân tích tổng hợp, sử dụng các sơ đồ phễu như dưới đây. Sơ đồ phễu của thuốc chẹn beta trong nhồi máu cơ tim

Bài báo năm 1997b tiếp tục nói rằng "nếu có sự thiên vị xuất bản, dự kiến, trong các nghiên cứu được công bố, những nghiên cứu lớn nhất sẽ báo cáo những tác động nhỏ nhất." Nhưng tại sao vậy? Dường như với tôi rằng tất cả những điều này sẽ chứng minh là những gì chúng ta đã biết: các hiệu ứng nhỏ chỉ có thể phát hiện được với kích thước mẫu lớn ; trong khi không nói gì về các nghiên cứu vẫn chưa được công bố.

Ngoài ra, công trình được trích dẫn tuyên bố rằng sự bất cân xứng được đánh giá trực quan trong một biểu đồ kênh "chỉ ra rằng đã không chọn lọc không công bố các thử nghiệm nhỏ hơn với lợi ích ít hơn." Nhưng, một lần nữa, tôi không hiểu làm thế nào bất kỳ tính năng nào của các nghiên cứu được công bố có thể cho chúng tôi biết bất cứ điều gì (cho phép chúng tôi suy luận) về các tác phẩm không được công bố!

Tài liệu tham khảo
Egger, M., Smith, GD, & Phillips, AN (1997). Phân tích tổng hợp: nguyên tắc và thủ tục . BMJ, 315 (7121), 1533-1537.

Egger, M., Smith, GD, Schneider, M., & Minder, C. (1997). Xu hướng trong phân tích tổng hợp được phát hiện bằng một thử nghiệm đồ họa đơn giản . BMJ , 315 (7109), 629-634.


Tôi không nghĩ rằng bạn có điều này đúng cách. Có lẽ câu trả lời cho câu hỏi và trả lời này có thể giúp thống kê.stackexchange.com/questions/214017/iêu
mdewey

7
Đối với một nghiên cứu nhỏ để được công bố, nó sẽ phải cho thấy hiệu ứng lớn cho dù kích thước hiệu ứng thực sự là bao nhiêu.
einar

Câu trả lời:


23

Các câu trả lời ở đây là tốt, +1 cho tất cả. Tôi chỉ muốn cho thấy hiệu ứng này có thể trông như thế nào trong các điều khoản của kênh trong một trường hợp cực đoan. Dưới đây tôi mô phỏng một hiệu ứng nhỏ là và vẽ các mẫu trong khoảng từ 2 đến 2000 quan sát.N(.01,.1)

Các điểm xám trong cốt truyện sẽ không được công bố theo chế độ nghiêm ngặt . Đường màu xám là một hồi quy của kích thước hiệu ứng trên kích thước mẫu bao gồm các nghiên cứu "giá trị p xấu", trong khi đường màu đỏ loại trừ những nghiên cứu này. Các đường màu đen cho thấy hiệu quả thực sự.p<.05

Như bạn có thể thấy, theo xu hướng xuất bản, có xu hướng mạnh mẽ cho các nghiên cứu nhỏ đánh giá quá cao kích thước hiệu ứng và đối với những nghiên cứu lớn hơn để báo cáo kích thước hiệu ứng gần với sự thật.

set.seed(20-02-19)

n_studies <- 1000
sample_size <- sample(2:2000, n_studies, replace=T)

studies <- plyr::aaply(sample_size, 1, function(size) {
  dat <- rnorm(size, mean = .01, sd = .1)
  c(effect_size=mean(dat), p_value=t.test(dat)$p.value)
})

studies <- cbind(studies, sample_size=log(sample_size))

include <- studies[, "p_value"] < .05

plot(studies[, "sample_size"], studies[, "effect_size"], 
     xlab = "log(sample size)", ylab="effect size",
     col=ifelse(include, "black", "grey"), pch=20)
lines(lowess(x = studies[, "sample_size"], studies[, "effect_size"]), col="grey", lwd=2)
lines(lowess(x = studies[include, "sample_size"], studies[include, "effect_size"]), col="red", lwd=2)
abline(h=.01)

Được tạo vào ngày 2019-02-20 bởi gói reprex (v0.2.1)


1
Điểm tuyệt vời, thực sự giúp hiểu điều này bằng trực giác, cảm ơn!
z8080

2
+1 Đồ họa này đáng giá cả ngàn từ và tóm tắt vấn đề tốt. Kiểu thiên vị này thậm chí có thể được tìm thấy khi kích thước hiệu ứng thực sự là 0.
Underminer

29

Đầu tiên, chúng ta cần suy nghĩ về "xu hướng xuất bản" là gì và nó sẽ ảnh hưởng đến những gì thực sự đưa nó vào văn học.

Một mô hình khá đơn giản cho xu hướng xuất bản là chúng tôi thu thập một số dữ liệu và nếu , chúng tôi sẽ xuất bản. Mặt khác, chúng tôi không. Vậy làm thế nào điều này ảnh hưởng đến những gì chúng ta thấy trong các tài liệu? Chà, đối với một, nó đảm bảo rằng (giả sử sử dụng thống kê Wald). Bây giờ, một điểm được đưa ra là nếu thực sự nhỏ, thì tương đối lớn và lớnlà cần thiết để xuất bản.p<0.05|θ^|/SE(θ^)>1.96nSE(θ^)|θ^|

Bây giờ giả sử rằng trong thực tế, tương đối nhỏ. Giả sử chúng tôi chạy 200 thử nghiệm, 100 với kích thước mẫu thực sự nhỏ và 100 với kích thước mẫu thực sự lớn. Lưu ý rằng trong số 100 thử nghiệm cỡ mẫu thực sự nhỏ, những thử nghiệm duy nhất sẽ được xuất bản theo mô hình thiên vị xuất bản đơn giản của chúng tôi là những thử nghiệm có giá trị lớn làchỉ do lỗi ngẫu nhiên . Tuy nhiên, trong 100 thử nghiệm của chúng tôi với kích thước mẫu lớn, các giá trị nhỏ hơn của sẽ được công bố. Vì vậy, nếu các thử nghiệm lớn hơn có hệ thống cho thấy hiệu quả nhỏ hơn các thử nghiệm nhỏ hơn, điều này cho thấy có lẽθ|θ^| q | θ |θ^|θ| thực sự nhỏ hơn đáng kể so với những gì chúng ta thường thấy từ các thí nghiệm nhỏ hơn thực sự biến nó thành ấn phẩm.

Lưu ý kỹ thuật: đúng là có một cái lớnvà / hoặc nhỏ sẽ dẫn đến . Tuy nhiên, vì kích thước hiệu ứng thường được coi là liên quan đến độ lệch chuẩn của thuật ngữ lỗi, hai điều kiện này về cơ bản là tương đương nhau.|θ^| S E ( θ ) p < 0,05SE(θ^)p<0,05


"Bây giờ, một điểm được đưa ra là nếu thực sự nhỏ, thì tương đối lớn và lớn là bắt buộc để xuất bản." Về mặt kỹ thuật, điều này không nhất thiết là đúng: : nếu rất nhỏ, thì một nhỏ có thể dẫn đến thậm chí cho một cỡ mẫu nhỏ, phải không? EDIT: Đợi đã! Chỉ cần đọc câu kết thúc của bạn. :) +1S E ( θ ) | θ | S E ( θ ) = S D ( θ )nSE(θ)|θ| SE(θ)SESE(θ)= =SD(θ)nSE(θ)SE
Alexis

19

Đọc tuyên bố này một cách khác:

Nếu không có sai lệch xuất bản, kích thước hiệu ứng nên độc lập với kích thước nghiên cứu.

Đó là, nếu bạn đang nghiên cứu một hiện tượng, kích thước hiệu ứng là một thuộc tính của hiện tượng đó, không phải là mẫu / nghiên cứu.

Ước tính kích thước hiệu ứng có thể (và sẽ) khác nhau giữa các nghiên cứu, nhưng nếu có kích thước hiệu ứng giảm có hệ thống với tăng kích thước nghiên cứu , điều đó cho thấy có sự sai lệch. Toàn bộ vấn đề là mối quan hệ này cho thấy rằng có những nghiên cứu nhỏ bổ sung cho thấy kích thước hiệu ứng thấp chưa được công bố, và nếu chúng được công bố và do đó có thể được đưa vào phân tích tổng hợp, ấn tượng chung sẽ là kích thước hiệu ứng nhỏ hơn hơn những gì được ước tính từ tập hợp con của các nghiên cứu được công bố.

Phương sai của ước tính kích thước hiệu ứng giữa các nghiên cứu sẽ phụ thuộc vào cỡ mẫu, nhưng bạn sẽ thấy số lượng ước tính dưới và trên bằng nhau ở cỡ mẫu thấp nếu không có sai lệch.


1
Nhưng có thực sự đúng khi nói rằng "Nếu không có sai lệch xuất bản, kích thước hiệu ứng nên độc lập với quy mô nghiên cứu"? Tất nhiên điều này đúng khi bạn đề cập đến hiệu ứng cơ bản thực sự, nhưng tôi nghĩ rằng họ đang đề cập đến hiệu quả ước tính. Một kích thước hiệu ứng mà phụ thuộc vào kích thước nghiên cứu (gợi ý thiên vị) chiếm một mối quan hệ tuyến tính trong đó biểu đồ phân tán (tương quan cao). Đây là điều mà cá nhân tôi chưa thấy trong bất kỳ sơ đồ kênh nào, mặc dù tất nhiên nhiều sơ đồ kênh đó đã ngụ ý rằng tồn tại một sự thiên vị.
z8080

2
@ z8080 Bạn đúng, chỉ khi ước tính độ lệch trung bình và độ lệch chuẩn không thiên vị thì kích thước hiệu ứng ước tính sẽ hoàn toàn độc lập với kích thước nghiên cứu nếu không có sai lệch xuất bản. Do độ lệch chuẩn của mẫu là sai lệch, sẽ có một số sai lệch trong ước tính kích thước hiệu ứng, nhưng độ lệch đó là nhỏ so với mức độ sai lệch trong các nghiên cứu mà Egger et al đang đề cập. Trong câu trả lời của tôi, tôi coi nó là không đáng kể, giả sử kích thước mẫu đủ lớn để ước tính SD gần như không thiên vị, và do đó coi nó là độc lập với quy mô nghiên cứu.
Bryan Krause

2
@ z8080 Phương sai của ước tính kích thước hiệu ứng sẽ phụ thuộc vào kích thước mẫu, nhưng bạn sẽ thấy số lượng ước tính dưới và trên bằng nhau ở cỡ mẫu thấp.
Bryan Krause

2
"Ước tính kích thước hiệu ứng có thể (và sẽ) khác nhau giữa các nghiên cứu, nhưng nếu có mối quan hệ hệ thống giữa kích thước hiệu ứng và kích thước nghiên cứu" Phrasing đó là một chút không rõ ràng về sự khác biệt giữa sự phụ thuộc và kích thước hiệu ứng. Sự phân bố kích thước hiệu ứng sẽ khác nhau đối với kích thước mẫu khác nhau và do đó sẽ không độc lập với kích thước mẫu, bất kể có sai lệch hay không. Xu hướng là một hướng hệ thống của sự phụ thuộc.
Tích lũy

@Acccumulation Bản chỉnh sửa của tôi có khắc phục được sự thiếu rõ ràng mà bạn đã thấy không?
Bryan Krause
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.