Kết hợp thông tin từ nhiều nghiên cứu để ước tính giá trị trung bình và phương sai của dữ liệu phân phối thông thường - phương pháp phân tích Bayesian và phân tích tổng hợp


21

Tôi đã xem xét một tập hợp các bài báo, mỗi báo cáo về giá trị trung bình và SD quan sát được của phép đo trong mẫu tương ứng có kích thước đã biết, . Tôi muốn đưa ra dự đoán tốt nhất có thể về sự phân phối có khả năng của cùng một biện pháp trong một nghiên cứu mới mà tôi đang thiết kế, và có bao nhiêu sự không chắc chắn trong dự đoán đó. Tôi rất vui khi giả sử ).n X ~ N ( μ , σ 2XnXN(μ,σ2

Suy nghĩ đầu tiên của tôi là phân tích tổng hợp, nhưng các mô hình thường sử dụng tập trung vào ước tính điểm và khoảng tin cậy tương ứng. Tuy nhiên, tôi muốn nói điều gì đó về phân phối đầy đủ của , trong trường hợp này cũng bao gồm cả việc đoán về phương sai, . σ 2Xσ2

Tôi đã đọc về các cách tiếp cận Bayeisan có thể để ước tính tập hợp đầy đủ các tham số của một phân phối nhất định theo kiến ​​thức trước. Điều này thường có ý nghĩa hơn đối với tôi, nhưng tôi không có kinh nghiệm với phân tích Bayes. Đây cũng có vẻ là một vấn đề đơn giản, tương đối đơn giản để cắt răng của tôi.

1) Với vấn đề của tôi, cách tiếp cận nào có ý nghĩa nhất và tại sao? Phân tích tổng hợp hoặc một cách tiếp cận Bayes?

2) Nếu bạn nghĩ cách tiếp cận Bayes là tốt nhất, bạn có thể chỉ cho tôi cách để thực hiện điều này (tốt nhất là trong R) không?

Câu hỏi liên quan

CHỈNH SỬA:

Tôi đã cố gắng thực hiện điều này theo cách mà tôi nghĩ là một cách Bayes 'đơn giản'.

Như tôi đã nói ở trên, tôi không chỉ quan tâm đến giá trị trung bình, ước tính , mà còn là phương sai, , trong ánh sáng của thông tin trước đó, tức làσ 2 P ( μ , σ 2 | Y )μσ2P(μ,σ2|Y)

Một lần nữa, tôi không biết gì về chủ nghĩa Baye trong thực tế, nhưng không mất nhiều thời gian để thấy rằng phần sau của phân phối bình thường với trung bình không xác định và phương sai có một giải pháp dạng kín thông qua liên hợp , với phân phối gamma nghịch đảo bình thường.

Vấn đề được định dạng lại là .P(μ,σ2|Y)=P(μ|σ2,Y)P(σ2|Y)

P(μ|σ2,Y) được ước tính với phân phối bình thường; với phân phối nghịch đảo gamma.P(σ2|Y)

Tôi phải mất một lúc để quay đầu lại, nhưng từ những liên kết này ( 1 , 2 ) tôi đã có thể, tôi nghĩ, để sắp xếp làm thế nào để làm điều này trong R.

Tôi bắt đầu với một khung dữ liệu được tạo thành từ một hàng cho mỗi 33 nghiên cứu / mẫu và các cột cho giá trị trung bình, phương sai và cỡ mẫu. Tôi đã sử dụng giá trị trung bình, phương sai và cỡ mẫu từ nghiên cứu đầu tiên, ở hàng 1, làm thông tin trước đó của tôi. Sau đó, tôi đã cập nhật thông tin này từ nghiên cứu tiếp theo, tính toán các tham số có liên quan và lấy mẫu từ gamma nghịch đảo bình thường để có được phân phối và . Điều này được lặp lại cho đến khi tất cả 33 nghiên cứu đã được đưa vào.σ 2μσ2

# Loop start values values

  i <- 2
  k <- 1

# Results go here

  muL      <- list()  # mean of the estimated mean distribution
  varL     <- list()  # variance of the estimated mean distribution
  nL       <- list()  # sample size
  eVarL    <- list()  # mean of the estimated variance distribution
  distL    <- list()  # sampling 10k times from the mean and variance distributions

# Priors, taken from the study in row 1 of the data frame

  muPrior  <- bayesDf[1, 14]    # Starting mean
  nPrior   <- bayesDf[1, 10]    # Starting sample size
  varPrior <- bayesDf[1, 16]^2  # Starting variance

  for (i in 2:nrow(bayesDf)){

# "New" Data, Sufficient Statistics needed for parameter estimation

    muSamp    <- bayesDf[i, 14]          # mean
    nSamp     <- bayesDf[i, 10]          # sample size
    sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1)  # sum of squares (variance * (n-1))

# Posteriors

    nPost   <- nPrior + nSamp
    muPost  <- (nPrior * muPrior + nSamp * muSamp) / (nPost)  
    sPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               ((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
    varPost <- sPost/nPost
    bPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               (nPrior * nSamp /  (nPost)) * ((muPrior - muSamp)^2)
# Update 

    muPrior   <- muPost
    nPrior    <- nPost
    varPrior  <- varPost

# Store

    muL[[i]]   <-  muPost
    varL[[i]]  <-  varPost
    nL[[i]]    <-  nPost
    eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)

# Sample

    muDistL  <- list()  
    varDistL <- list()

    for (j in 1:10000){
      varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
      v             <- 1/rgamma(1, nPost/2, bPost/2)
      muDistL[[j]]  <- rnorm(1, muPost, v/nPost)
    }

# Store 

    varDist    <- do.call(rbind, varDistL)
    muDist     <- do.call(rbind, muDistL)
    dist       <- as.data.frame(cbind(varDist, muDist))
    distL[[k]] <- dist

# Advance

    k <- k+1 
    i <- i+1

  }

  var     <- do.call(rbind, varL)
  mu      <- do.call(rbind, muL)
  n       <- do.call(rbind, nL)
  eVar    <- do.call(rbind, eVarL)
  normsDf <- as.data.frame(cbind(mu, var, eVar, n)) 
  colnames(seDf) <- c("mu", "var", "evar", "n")
  normsDf$order <- c(1:33)

Dưới đây là sơ đồ đường dẫn cho thấy và thay đổi như thế nào khi mỗi mẫu mới được thêm vào.E ( σ 2 )E(μ)E(σ2)

nhập mô tả hình ảnh ở đây

Dưới đây là các giá trị dựa trên việc lấy mẫu từ các bản phân phối ước tính cho giá trị trung bình và phương sai tại mỗi bản cập nhật.

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Tôi chỉ muốn thêm cái này trong trường hợp nó hữu ích cho người khác, và để những người hiểu biết có thể cho tôi biết liệu điều này có hợp lý, thiếu sót, v.v.

Câu trả lời:


11

Hai cách tiếp cận (phân tích tổng hợp và cập nhật Bayes) không thực sự khác biệt. Các mô hình siêu phân tích trên thực tế thường được đóng khung như các mô hình Bayes, vì ý tưởng thêm bằng chứng vào kiến ​​thức trước đó (có thể khá mơ hồ) về hiện tượng trong tay cho phép phân tích tổng hợp một cách tự nhiên. Một bài viết mô tả kết nối này là:

Brannick, MT (2001). Ý nghĩa của phân tích tổng hợp Bayes theo kinh nghiệm để xác nhận thử nghiệm. Tạp chí Tâm lý học ứng dụng, 86 (3) , 468-480.

(tác giả sử dụng các mối tương quan làm thước đo kết quả cho phân tích tổng hợp, nhưng nguyên tắc là như nhau bất kể biện pháp nào).

Một bài viết tổng quát hơn về các phương pháp Bayes để phân tích tổng hợp sẽ là:

Sutton, AJ, & Abrams, KR (2001). Phương pháp Bayes trong phân tích tổng hợp và tổng hợp bằng chứng. Phương pháp thống kê trong nghiên cứu y học, 10 (4) , 277-303.

Những gì bạn dường như là sau (ngoài một số ước tính kết hợp) là khoảng dự đoán / độ tin cậy mô tả nơi trong một nghiên cứu trong tương lai, kết quả / hiệu quả thực sự có khả năng giảm. Người ta có thể có được một khoảng thời gian như vậy từ phân tích tổng hợp "truyền thống" hoặc từ mô hình phân tích tổng hợp Bayes. Cách tiếp cận truyền thống được mô tả, ví dụ, trong:

Riley, RD, Higgins, JP, & Deek, JJ (2011). Giải thích các phân tích meta hiệu ứng ngẫu nhiên. Tạp chí Y học Anh , số 34, d549.

Trong ngữ cảnh của mô hình Bayes (ví dụ: mô hình hiệu ứng ngẫu nhiên được mô tả bởi phương trình 6 trong bài báo của Sutton & Abrams, 2001), người ta có thể dễ dàng có được phân phối sau của , trong đó là đúng kết quả / hiệu quả trong nghiên cứu thứ (vì các mô hình này thường được ước tính bằng MCMC, người ta chỉ cần theo dõi chuỗi cho sau một khoảng thời gian thích hợp). Từ phân phối sau đó, người ta có thể có được khoảng tin cậy.θiθiiθi


3
Thêm vào đó, nhiều người Bayes trước đã được thực hiện từ kết quả phân tích tổng hợp.
Fomite

2

Nếu tôi hiểu chính xác câu hỏi của bạn, thì điều này khác với thiết lập phân tích tổng hợp thông thường ở chỗ bạn muốn ước tính không chỉ một phương tiện chung mà còn là một phương sai chung. Vì vậy, mô hình mẫu cho các dữ liệu thô là để quan sát từ nghiên cứu . Nếu điều đó đúng, thì tôi nghĩ MLE của chỉ đơn giản là trung bình mẫu gộp, nghĩa là MLE cho phức tạp hơn một chút vì nó liên quan đến cả phương sai trong và giữa nghiên cứu (nghĩ về ANOVA một chiều). Nhưng chỉ gộp các phương sai mẫu cũng hoạt động (nghĩa là một công cụ ước tính không thiên vị củayijN(μ,σ2)i=1,...njj=1,...,Kμσ σ 2 ~ σ 2 = 1

μ^=1Nj=1Knjy¯j,N=j=1Knj.
σσ2): Nếu lớn, không quá lớn, và bạn là sử dụng các linh mục yếu, thì ước tính Bayes sẽ khá giống với những điều này. NK
σ~2=1NKj=1K(nj1)sj2
NK
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.