Trong một phân tích tổng hợp, làm thế nào một người nên xử lý các nghiên cứu không quan trọng không chứa dữ liệu thô?


9

Hãy nói rằng tôi đang tiến hành phân tích tổng hợp, xem xét hiệu suất của nhóm A và nhóm B liên quan đến một cấu trúc nhất định. Bây giờ, một số nghiên cứu mà tôi đi qua sẽ báo cáo rằng không thể tìm thấy sự khác biệt thống kê giữa hai nhóm nhưng không có thống kê kiểm tra chính xác và / hoặc dữ liệu thô sẽ được trình bày. Trong một phân tích tổng hợp, tôi nên xử lý các nghiên cứu như thế nào?

Về cơ bản, tôi thấy ba lựa chọn thay thế khác nhau ở đây:

  1. Bao gồm tất cả chúng và gán cho mỗi một kích thước hiệu ứng bằng 0.
  2. Ném tất cả ra ngoài.
  3. Thực hiện một số loại phân tích sức mạnh cho từng người trong số họ hoặc đặt ngưỡng ở một số lượng người tham gia nhất định. Bao gồm tất cả những gì đáng lẽ có thể đạt được ý nghĩa thống kê và gán cho mỗi người một kích thước hiệu ứng bằng 0. Vứt phần còn lại ra.

Tôi có thể thấy công đức với tất cả các tùy chọn khác nhau. Tùy chọn một là khá bảo thủ và bạn sẽ chỉ có nguy cơ mắc lỗi loại II. Tùy chọn hai làm tăng nguy cơ mắc lỗi loại I, nhưng nó cũng tránh cho kết quả của bạn bị hủy hoại vì một loạt các nghiên cứu thiếu năng lực. Tùy chọn ba có vẻ giống như đường giữa giữa tùy chọn một và tùy chọn hai, nhưng sẽ có rất nhiều giả định và / hoặc dự đoán thuần túy (Bạn nên dựa trên kích thước hiệu ứng nào để phân tích sức mạnh của mình? nghiên cứu cho nó để vượt qua?), có lẽ làm cho kết quả cuối cùng ít đáng tin cậy và chủ quan hơn.


Đừng gán số 0, vì đó là sự đánh giá thấp về hiệu ứng. Một cách tiếp cận là gán giá trị kích thước hiệu ứng được liên kết với giá trị p là 0,5 (giá trị p dự kiến ​​nếu giả thuyết null là đúng).
Jeremy Miles

1
Điều gì sẽ khiến bạn thậm chí lướt qua -value khi quyết định làm gì với một nghiên cứu khi đưa vào phân tích tổng hợp? Hãy suy nghĩ ước tính không kiểm tra giả thuyết . P
Frank Harrell

@JeremyMiles "Đừng gán số 0, vì đó là sự đánh giá thấp về hiệu ứng." - Là nó? Ý tôi là, nó thể, nhưng vì không có sẵn dữ liệu, tôi chỉ đơn giản là không thể biết tác dụng thực sự của những nghiên cứu này là gì.
Speldosa

@FrankHarrell Các nghiên cứu báo cáo kết quả không đáng kể cho bạn một gợi ý về kích thước hiệu quả thực tế cho nghiên cứu đó có thể là gì. Các nghiên cứu không báo cáo bất cứ điều gì hoàn toàn vô dụng và chỉ gây ra tiếng ồn trừ khi người ta cho rằng có sự thiên vị đối với việc không báo cáo bất cứ điều gì (thậm chí không phải là một thử nghiệm thống kê thất bại) khi không có hiệu ứng (có lẽ người ta cho rằng đây là trường hợp ?). Câu hỏi tôi đang điều tra để phân tích tổng hợp là một câu hỏi thường không phải là câu hỏi chính (hoặc thậm chí không phải là câu hỏi mà các tác giả đang hỏi) về các nghiên cứu mà tôi đang xem xét.
Speldosa

1
@JeremyMiles Tôi biết bạn đã cung cấp 'ước tính kích thước hiệu ứng của bạn dựa trên giá trị p là 0,5' một lúc trước - bạn có biết bất kỳ công việc nào tôi có thể trích dẫn nếu tôi áp dụng phương pháp này không? Tôi rất biết ơn sự giúp đỡ!

Câu trả lời:


9

Như bạn chỉ ra, có những công đức với cả ba cách tiếp cận. Rõ ràng không có một lựa chọn nào là 'tốt nhất'. Tại sao không làm cả 3 và trình bày kết quả dưới dạng phân tích độ nhạy?

Một phân tích tổng hợp được thực hiện với các phân tích độ nhạy phù hợp và phong phú chỉ cho thấy tác giả nhận thức rõ các giới hạn của dữ liệu trong tay, cho thấy rõ sự ảnh hưởng của các lựa chọn chúng tôi đưa ra khi tiến hành phân tích tổng hợp và có thể đánh giá phê bình hậu quả. Đối với tôi, đó là dấu hiệu của phân tích tổng hợp được tiến hành tốt.

Bất cứ ai đã từng thực hiện phân tích tổng hợp đều biết rất rõ rằng có nhiều lựa chọn và quyết định được đưa ra trên đường đi và những lựa chọn và quyết định đó có thể có ảnh hưởng đáng kể đến kết quả thu được. Ưu điểm của phân tích tổng hợp (hay nói chung hơn là tổng quan hệ thống) là các phương pháp (và do đó các lựa chọn và quyết định) được đưa ra rõ ràng. Và người ta có thể đánh giá ảnh hưởng của họ một cách có hệ thống. Đó chính xác là cách phân tích tổng hợp nên được tiến hành.


4

Dưới đây là các bước tôi sẽ thực hiện (và tôi dạy cho học sinh của mình):

1) Liên hệ với các tác giả của nghiên cứu ban đầu. Hãy lịch sự và yêu cầu ước tính hiệu quả chính xác để sử dụng trong phân tích tổng hợp của bạn. Điều tồi tệ nhất có thể xảy ra là họ không trả lời hoặc từ chối cung cấp cho bạn thông tin. Trường hợp tốt nhất là bạn có được thông tin chính xác mà bạn đang tìm kiếm.

2) Nếu bạn có giá trị p chính xác, bạn có thể thường xuyên tính toán lại SD với một mức độ chắc chắn.

3) Bạn thực hiện một số loại. Điều này có thể sử dụng 'mượn' ước tính hiệu quả từ các thử nghiệm có kích thước tương tự, SD lớn nhất trong phân tích tổng hợp, SD từ các nghiên cứu tương tự trong cùng phân tích meta, ý kiến ​​chuyên gia, v.v. Có nhiều cách để đánh giá dữ liệu bị thiếu, một số cách chính xác hơn về mặt khoa học so với những người khác, nhưng điều quan trọng nhất là bạn rõ ràng về những gì bạn đã làm và tiến hành phân tích độ nhạy để xác định ảnh hưởng của (các) tranh chấp đối với ước tính hiệu ứng gộp.

3) Bạn đặt chúng vào các nghiên cứu trong phân tích tổng hợp với dữ liệu còn thiếu. Chương trình (ví dụ RevMan) sẽ không cung cấp cho các nghiên cứu này bất kỳ trọng số nào trong phân tích vì nó sẽ không thể tính được ước tính hiệu quả và phương sai cho nghiên cứu đó, nhưng bạn sẽ có thể hiển thị trực quan rằng có các nghiên cứu bổ sung với dữ liệu từng phần đó không phải là một phần của tính toán gộp.

4) Bạn không bao gồm dữ liệu từ các nghiên cứu này.

Chọn bạn độc ...

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.