Hồi quy đa biến đa cấp


8

Bối cảnh:
Tôi muốn tiến hành hồi quy meta bằng các nghiên cứu có (1) một số kết quả / cấu trúc (= đa biến) và (2) nhiều kích cỡ hiệu ứng cho mỗi kết quả này vì các biện pháp khác nhau. Đây là một kế hoạch hy vọng giải thích nó tốt nhất:

  • Nghiên cứu 1, Kết quả A, Hiệu ứng kích thước 1
  • Nghiên cứu 1, Kết quả A, Hiệu ứng kích thước 2
  • Nghiên cứu 1, Kết quả B, Kích thước hiệu ứng 3
  • Nghiên cứu 2, Kết quả A, Hiệu ứng kích thước 4
  • Nghiên cứu 2, Kết quả C, Hiệu ứng kích thước 5
  • Nghiên cứu 2, Kết quả C, Hiệu ứng kích thước 6
  • ...

Các nghiên cứu so sánh phương tiện của hai nhóm về kết quả và kích cỡ hiệu ứng khác nhau là Hedge g.

Một ví dụ thực tế sẽ là "Bộ nhớ làm việc" có thể được chia thành các kết quả khác nhau (Baddeley, 1974), ví dụ "Vòng lặp âm vị học", "Bảng vẽ phác thảo trực quan" hoặc "Điều hành trung tâm".
Ví dụ: Nghiên cứu 1 đánh giá "Vòng lặp âm vị" (Kết quả A) với hai biện pháp khác nhau (= Kích thước hiệu ứng 1 và 2) và "Điều hành trung tâm" (Kết quả B) với một biện pháp (= Kích thước hiệu ứng 3).

Vấn đề:
Một cách tiếp cận đa biến thích hợp đòi hỏi phải biết mọi mối tương quan giữa kích thước hiệu ứng và kết quả để ước tính hiệp phương sai. Tuy nhiên tôi không biết (1) mối tương quan giữa các kích cỡ hiệu ứng khác nhau trong cùng một nghiên cứu và (2) mối tương quan giữa các kết quả của các nghiên cứu khác nhau. Tôi có thể ước tính chúng hoặc cố gắng tìm ít nhất một vài mối tương quan để làm việc, nhưng điều đó có nghĩa là rất nhiều tìm kiếm tài liệu bổ sung mà tôi muốn tránh.

Giải pháp (cho đến nay):
Tôi đã bắt gặp một vài phương pháp xử lý các vấn đề tương tự.
Ước tính phương sai mạnh mẽ (Hedges, 2010) là một cách tiếp cận hay để đối phó với nhiều kích cỡ hiệu ứng. Tuy nhiên tôi vẫn phải đoán một mối tương quan và thực hiện phân tích độ nhạy và dường như không thể so sánh một số kết quả (nghĩa là chỉ có hồi quy meta đơn biến).
Cách tiếp cận đa cấp của Van den Noorgate (2014) đầy hứa hẹn vì không cần ước tính bất kỳ mối tương quan nào bằng cách cho phép thay đổi giữa kích thước hiệu ứng và giữa kích thước hiệu ứng trong các nghiên cứu. Một phân tích meta đa biến đa cấp (= kết quả khác nhau và nhiều kích cỡ hiệu ứng như trong sơ đồ trên) và hồi quy meta đa biến đơn biến (= nhiều kích thước hiệu ứng nhưng không có sự khác biệt giữa các kết quả) được mô tả.

Sử dụng gói metafor trong R Tôi tự hỏi liệu tôi có thể kết hợp cả hai cách tiếp cận đa cấp và thực hiện hồi quy meta đa biến đa cấp hay không. Ví dụ về phân tích meta đa cấp và hồi quy meta đa biến bằng metafor được đưa ra ở đây http://www.metafor-project.org/doku.php/analyses:konstantopoulos2011 (đa cấp) và tại đây http: //www.metafor- project.org/doku.php/analyses:berkey1998 (đa biến). (Xin lưu ý rằng ví dụ đa cấp được liên kết ở trên thực sự mô tả một cách tiếp cận để đối phó với các phụ thuộc phân cấp (ví dụ: các nghiên cứu được thực hiện bởi cùng một phòng thí nghiệm nghiên cứu). Thay vào đó tôi sử dụng phương pháp đa cấp được mô tả bởi Van den Noorgate.)

Các biến:
ES: Kích thước hiệu ứng (Hedge g)
VI: Phương sai kích thước hiệu ứng
Pub_Year: Năm xuất bản với tư cách là công cụ dự đoán trong hồi quy meta
ES_ID: Mỗi kích thước hiệu ứng đều có một ID duy nhất, bất kể chúng thuộc về nghiên cứu hay kết quả nào.
Outcome_ID: Các kết quả tương tự có cùng một ID (ví dụ: "Vòng lặp âm vị" = 1, "Điều hành trung tâm" = 2), bất kể chúng thuộc về nghiên cứu nào.
Research_ID: Kích thước hiệu ứng của cùng một nghiên cứu có cùng ID (ví dụ: Kích thước hiệu ứng của nghiên cứu 1 = 1, Kích thước hiệu ứng của nghiên cứu 2 = 2), bất kể kết quả của chúng thuộc về kết quả nào.

Mã R trong metafor cho phân tích meta đa biến đa cấp:
rma.mv (ES, VI, mods = ~ Outcome_ID -1, Random = list (~ 1 | Study_ID, ~ 1 | ES_ID), data = data.set)

  • mods = ~ Outcome_ID -1 gọi cho cách tiếp cận đa biến và liệt kê kích thước hiệu ứng trung bình cho mọi kết quả.
  • Random = list (~ 1 | Study_ID, ~ 1 | ES_ID) là cách tiếp cận đa cấp được mô tả bởi Van den Noorgate. Nó cho phép thay đổi ngẫu nhiên giữa các kích thước hiệu ứng trong các nghiên cứu (~ 1 | Study_ID) và giữa các kích thước hiệu ứng (~ 1 | ES_ID). Bạn cũng có thể tiến hành phân tích này bằng gói metaSEM. Kết quả giống hệt nhau.

Mã R trong metafor cho hồi quy meta đa biến đa cấp:
rma.mv (ES, VI, mods = ~ Outcome_ID + Kết quả: Tôi (Pub_Year-mean (Pub_Year)) -1, Random = list (~ 1 | Study_ID, ~ 1 | ES_ID), dữ liệu = data.set)

  • mods = ~ Outcome_ID + Kết quả: Tôi (Pub_Year-mean (Pub_Year)) -1 bây giờ yêu cầu hồi quy meta đa biến với Năm xuất bản tập trung quanh ý nghĩa như một công cụ dự đoán.

Sử dụng tùy chọn profile () trong metafor, Sơ đồ khả năng hồ sơ trông ổn. Tuy nhiên, tôi vẫn tự hỏi nếu tôi không định lượng quá mức mô hình hoặc nếu có gì đó sai khi kết hợp các đối số mod và ngẫu nhiên theo cách này.
Mong ý kiến ​​của bạn, đề xuất, ý tưởng, cách tiếp cận khác, mọi thứ ;-) Cảm ơn!


Cập nhật, trả lời câu trả lời của Wolfgang:

Trước hết: Cảm ơn rất nhiều về câu trả lời chi tiết của bạn và các liên kết bổ sung mà bạn đã cung cấp. Tôi không biết về danh sách gửi thư mô hình hỗn hợp R-sig. Vì vậy, cảm ơn! Tôi đánh giá cao điều đó rất nhiều.

Hãy để tôi thử tổng hợp mọi thứ và điều chỉnh nó phù hợp với tình huống của tôi để xem tôi có hiểu mọi thứ ngay tại đây không. Tôi có thể làm những điều sau đây:

  1. Có được mối tương quan: Thật không may là mối tương quan không được báo cáo. Ban đầu, phân tích tổng hợp bao gồm hơn 50 nghiên cứu. Gần một nửa các nghiên cứu đã mất hoặc không báo cáo dữ liệu. Mọi tác giả của những nghiên cứu này đều được liên lạc và tôi nhận được 4 phản hồi trong số 26 yêu cầu (sau 2 tháng chờ đợi). Nhưng đó là một vấn đề báo cáo chung không được thảo luận ở đây.

  2. Nếu tôi dự đoán sơ bộ về tất cả các mối tương quan tôi có thể:
    Tiến hành phân tích tổng hợp đa biến và hồi quy meta như trong Berkey et al. (1998) ví dụ và làm một phân tích độ nhạy.
    Sử dụng mô hình phân tích tổng hợp đa biến được trang bị này và làm việc với hàm mạnh (). Tuy nhiên, không có hồi quy meta dựa trên hàm mạnh () dường như có thể có trong metafor. Và hàm mạnh mẽ () được mô tả trong blog của James Pustejovsky chỉ hoạt động với các hồi quy meta đơn biến. Vì vậy, nếu tôi hiểu đúng, các ước tính của hàm mạnh () ít nhiều sẽ xác nhận các ước tính của mô hình đã được trang bị của tôi (?).
    Trực tiếp đi cho các phương pháp mạnh mẽ và sử dụng gói robumeta. Tuy nhiên không có phân tích tổng hợp đa biến nào là có thể. Tôi tìm thấy một mã SASđể xử lý vấn đề này. Nhưng mã được phát triển 3 năm trước và dường như nó chưa bao giờ thực sự được thảo luận. Cuối cùng, khi sử dụng robumeta, tôi phải tóm tắt rất nhiều kết quả khác nhau thành một phân tích tổng hợp lớn hoặc tôi phải tiến hành một số phân tích tổng hợp đơn biến cho mỗi kết quả mà tôi muốn tránh.

  3. Nếu tôi không muốn đoán bất kỳ mối tương quan nào, tôi có thể đi theo phương pháp đa cấp như được mô tả bởi Van den Noorgate bằng metafor, metaSEM hoặc SAS. Tuy nhiên, có một số hạn chế khi sử dụng phương pháp này so với cách tiếp cận đa biến dựa trên các mối tương quan. Ngoài ra, tôi không chắc liệu có thể hồi quy meta đa biến đa cấp hay không. Gói metaSEM chỉ mô tả phân tích meta đa biến đa cấp hoặc hồi quy meta đa biến đơn biến.

Thật không may, tôi không quen với việc sử dụng các phương pháp lấy mẫu lại trong phân tích tổng hợp. Tôi đã nghiên cứu các ví dụ của bạn nhưng tôi không chắc nó có thể giúp tôi giải quyết vấn đề tương quan / đa biến thế như thế nào. Ý bạn là tôi nên cố gắng ước tính các mối tương quan bằng cách sử dụng bootstrapping? Và nếu vậy, tôi không chắc giá trị nào sẽ tương quan vì số lượng phương tiện hoặc kích cỡ hiệu ứng trong và giữa các nghiên cứu khác nhau.

Việc đơn giản hóa mô hình được mô tả bởi Riley và các đồng nghiệp nghe có vẻ thú vị. Tôi ghi nhớ nó, mặc dù tôi muốn làm việc với một trong những phương pháp được mô tả ở trên.


Một điều chỉnh nhỏ: Bạn nói rằng đối với cách tiếp cận đa biến thích hợp, bạn cần biết "(1) mối tương quan giữa các kích cỡ hiệu ứng khác nhau trong cùng một nghiên cứu và (2) mối tương quan giữa kết quả của các nghiên cứu khác nhau". Tuy nhiên, kết quả từ các nghiên cứu khác nhau (thường được giả định là độc lập), vì vậy bạn chỉ cần biết (1).
Wolfgang

Suy nghĩ ban đầu của tôi là cùng một kết quả của các nghiên cứu khác nhau (ví dụ: Vòng âm vị trong nghiên cứu 1 và nghiên cứu 2) tương quan cao hơn so với kết quả khác nhau của các nghiên cứu khác nhau (ví dụ: Vòng âm vị trong nghiên cứu 1 và điều hành trung tâm trong nghiên cứu 2) vì vậy nó cần được chăm sóc của. Nhưng tôi nghĩ rằng tôi đã hiểu lầm những điều ở đây. Vì vậy, cảm ơn đã làm rõ nó.
Stefan

Không chắc chắn lý do tại sao bạn viết "không có hồi quy meta dựa trên hàm mạnh () dường như có thể có trong metafor". Chỉ cần chạy robust()trên các rma.mvmô hình mà bạn đã viết trong câu hỏi của bạn (với biến Study_IDlà phân cụm). Vì các mô hình này giả định các lỗi lấy mẫu độc lập, chúng bị sai. Cách tiếp cận mạnh mẽ sẽ cho bạn kết quả phù hợp ngay cả khi phần ma trận phương sai hiệp phương sai của mô hình bị sai.
Wolfgang

@Stefan Bạn đã bao giờ giải quyết vấn đề của mình chưa? Nếu vậy, một mô tả cập nhật về cách bạn đã làm sẽ được đánh giá cao!
Speldosa

2
@ Speldosa: Xin lỗi vì trả lời rất muộn này. 1) Tôi đã dự đoán sơ bộ về mối tương quan giữa các kết quả trong mỗi nghiên cứu và xây dựng ma trận phương sai hiệp phương sai bằng công thức Gleser và Olkin (2009) từ Sổ tay tổng hợp nghiên cứu và phân tích tổng hợp. 2) Sử dụng ma trận này, tôi đã chạy một phân tích meta đa biến thông thường bằng cách sử dụng metafor (lệnh rma.mv). Tôi nghĩ rằng phân tích tổng hợp đa biến vẫn chưa được đánh giá đủ. 3) Để có được ước tính mạnh mẽ, tôi đã chạy mạnh mẽ () với mô hình rma.mv. 4) Để kiểm tra mối tương quan của tôi, tôi đã phân tích độ nhạy và thực hiện lại các bước 1-3.
Stefan

Câu trả lời:


8

Như bạn lưu ý, mô hình thêm các hiệu ứng ngẫu nhiên cho mỗi nghiên cứu và các hiệu ứng ngẫu nhiên cho từng kết quả là một mô hình chiếm sự phụ thuộc theo thứ bậc. Mô hình này cho phép các kết quả / hiệu ứng thực sự trong một nghiên cứu được tương quan. Đây là ví dụ Konstantopoulos (2011) mà bạn liên kết đến.

Nhưng mô hình này vẫn cho rằng các lỗi lấy mẫu của các kết quả / hiệu ứng quan sát được trong một nghiên cứu là độc lập, điều này chắc chắn không xảy ra khi các kết quả đó được đánh giá trong cùng một cá nhân. Vì vậy, như trong Berkey et al. (1998) ví dụ bạn liên kết đến, lý tưởng nhất là bạn cần xây dựng toàn bộ ma trận phương sai hiệp phương sai của các lỗi lấy mẫu (với phương sai lấy mẫu dọc theo đường chéo). Chương của Gleser và Olkin (2009) từ Sổ tay tổng hợp nghiên cứu và phân tích tổng hợp mô tả cách thức hiệp phương sai có thể được tính toán cho các biện pháp kết quả khác nhau (bao gồm cả sự khác biệt trung bình được tiêu chuẩn hóa). Các phân tích / phương pháp từ chương đó được sao chép ở đây (bạn đang xử lý trường hợp nhiều điểm cuối).

Và như bạn lưu ý, làm điều này đòi hỏi phải biết các phép đo thực tế trong các nghiên cứu có mối tương quan như thế nào. Sử dụng ví dụ của bạn, bạn sẽ cần biết cho nghiên cứu 1 mức độ tương quan giữa hai phép đo đối với "vòng âm vị" (chính xác hơn là có hai tương quan, một cho nhóm thứ nhất và một cho nhóm thứ hai, nhưng chúng ta thường cho rằng rằng mối tương quan là giống nhau cho hai nhóm) và các phép đo đó tương quan mạnh như thế nào với các phép đo "Điều hành trung tâm". Vì vậy, ba tương quan trong tổng số.

Có được / trích xuất các mối tương quan này thường rất khó, nếu không nói là không thể (vì chúng thường không được báo cáo). Nếu bạn thực sự không thể có được chúng (ngay cả sau khi liên hệ với các tác giả nghiên cứu trong nỗ lực để có được thông tin còn thiếu), có một số tùy chọn:

  1. Người ta vẫn có thể thường đưa ra một phỏng đoán thô / có giáo dục về mức độ tương quan lớn như thế nào. Sau đó, chúng tôi sử dụng các 'khách mời' đó và tiến hành phân tích độ nhạy để đảm bảo rằng kết luận không thay đổi khi các giá trị được thay đổi trong phạm vi hợp lý.

  2. Người ta có thể sử dụng các phương pháp mạnh - về bản chất, sau đó chúng tôi coi ma trận hiệp phương sai giả định của các lỗi lấy mẫu là sai chính tả (nghĩa là chúng tôi giả sử đó là đường chéo, trong khi thực tế chúng tôi biết nó không phải là) và sau đó ước tính phương sai ma trận đa phương thức của các hiệu ứng cố định (thường là lợi ích chính) sử dụng các phương pháp nhất quán ngay cả dưới một lỗi chính tả mô hình như vậy. Đây thực chất là cách tiếp cận được mô tả bởi Hedges, Tipton và Johnson (2010) mà bạn đã đề cập.

  3. Các phương pháp lấy mẫu lại (nghĩa là kiểm tra bootstrapping và hoán vị) cũng có thể hoạt động.

  4. Ngoài ra còn có một số mô hình thay thế cố gắng phá vỡ vấn đề bằng cách đơn giản hóa một số mô hình. Cụ thể, trong mô hình / cách tiếp cận của Riley và các đồng nghiệp (xem, ví dụ: Riley, Abrams, Lambert, Sutton, & Thompson, 2007, Statistics in Medicine, 26, 78-97), chúng tôi giả định rằng mối tương quan giữa các lỗi lấy mẫu là giống hệt với mối tương quan giữa các hiệu ứng thực sự tiềm ẩn, và sau đó chúng tôi chỉ ước tính rằng một mối tương quan. Điều này có thể hoạt động, nhưng liệu nó có phụ thuộc vào mức độ đơn giản hóa đó phù hợp với thực tế hay không.

  5. Luôn có một lựa chọn khác: Tránh mọi loại phụ thuộc thống kê thông qua việc giảm dữ liệu (ví dụ: chỉ chọn một ước tính, tiến hành phân tích riêng cho các kết quả khác nhau). Đây vẫn là cách tiếp cận được sử dụng phổ biến nhất để 'xử lý' vấn đề, bởi vì nó cho phép các học viên gắn bó với các mô hình / phương pháp / phần mềm (tương đối đơn giản) mà họ đã quen thuộc. Nhưng cách tiếp cận này có thể lãng phí và hạn chế suy luận (ví dụ: nếu chúng tôi tiến hành hai phân tích tổng hợp riêng biệt cho kết quả A và B, chúng tôi không thể kiểm tra xem hiệu quả ước tính có khác với A và B hay không trừ khi chúng tôi có thể giải thích lại cho hiệp phương sai của chúng).

Lưu ý: Vấn đề tương tự đã được thảo luận trong danh sách gửi thư mô hình hỗn hợp R-sig và về bản chất tôi đang lặp lại những gì tôi đã đăng ở đó. Xem ở đây .

Đối với phương pháp mạnh mẽ, bạn có thể thử gói robumeta . Nếu bạn muốn dính vào metafor, bạn sẽ tìm thấy những , viết blog , viết bởi James Pustejovsky quan tâm. Ông cũng đang làm việc trên một gói khác, được gọi là clubSandwich , bổ sung một số hiệu chỉnh mẫu nhỏ bổ sung. Bạn cũng có thể thử phiên bản phát triển của metafor(xem tại đây ) - nó bao gồm một chức năng mới được gọi là robust()bạn có thể sử dụng sau khi bạn đã trang bị mô hình của mình để có được các thử nghiệm mạnh mẽ và khoảng tin cậy. Và bạn có thể tìm thấy một số mã để giúp bạn bắt đầu với bootstrapping tại đây .


Đó là rất nhiều cho câu trả lời của bạn Wolfgang. Tôi đã cập nhật bài đăng đầu tiên của mình bằng một phản hồi (dài hơn trường bình luận có thể xử lý).
Stefan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.