Các giá trị bình phương R cực lớn trong hồi quy meta (metafor)


8

Tôi đang sử dụng gói metafor trong R. Tôi phù hợp với mô hình hiệu ứng ngẫu nhiên với bộ dự đoán liên tục như sau

SIZE=rma(yi=Ds,sei=SE,data=VPPOOLed,mods=~SIZE)

Sản lượng nào mang lại đầu ra:

R^2 (amount of heterogeneity accounted for):            63.62%
Test of Moderators (coefficient(s) 2): 
QM(df = 1) = 9.3255, p-val = 0.0023

Model Results:

                 se    zval    pval   ci.lb   ci.ub    
intrcpt  0.3266  0.1030  3.1721  0.0015  0.1248  0.5285  **
SIZE     0.0481  0.0157  3.0538  0.0023  0.0172  0.0790  **

Dưới đây tôi đã vẽ đồ thị hồi quy. Các kích thước hiệu ứng được vẽ theo tỷ lệ nghịch với sai số chuẩn. Tôi nhận ra rằng đây là một tuyên bố chủ quan, nhưng giá trị R2 (giải thích phương sai 63%) có vẻ lớn hơn nhiều so với được phản ánh bởi mối quan hệ khiêm tốn được hiển thị trong cốt truyện (thậm chí tính đến trọng số).

nhập mô tả hình ảnh ở đây

Để cho bạn biết ý tôi là gì, Nếu sau đó tôi thực hiện hồi quy tương tự với hàm lm (chỉ định trọng số nghiên cứu theo cùng một cách):

lmod=lm(Ds~SIZE,weights=1/SE,data=VPPOOLed)

Sau đó, R2 giảm xuống 28% phương sai giải thích. Điều này có vẻ gần với cách mọi thứ hơn (hoặc ít nhất, ấn tượng của tôi về loại R2 nên tương ứng với cốt truyện).

Tôi nhận ra, sau khi đọc bài viết này (bao gồm cả phần hồi quy meta): ( http://www.metafor-project.org/doku.php/tips:rma_vs_lm_and_lme ), sự khác biệt trong cách áp dụng các hàm lm và rma trọng lượng có thể ảnh hưởng đến các hệ số mô hình. Tuy nhiên, tôi vẫn chưa rõ tại sao các giá trị R2 lại lớn hơn nhiều trong trường hợp hồi quy meta. Tại sao một mô hình có vẻ phù hợp khiêm tốn chiếm hơn một nửa sự không đồng nhất trong các hiệu ứng?

Là giá trị R2 lớn hơn bởi vì phương sai được phân vùng khác nhau trong trường hợp phân tích meta? (biến thiên lấy mẫu v các nguồn khác) Cụ thể, R2 có phản ánh tỷ lệ phần trăm không đồng nhất chiếm trong phần không thể quy cho biến thiên lấy mẫu không? Có lẽ có một sự khác biệt giữa "phương sai" trong hồi quy không phân tích meta và "không đồng nhất" trong hồi quy siêu phân tích mà tôi không đánh giá cao.

Tôi sợ những phát biểu chủ quan như "Có vẻ không đúng" là tất cả những gì tôi phải tiếp tục ở đây. Bất kỳ trợ giúp nào trong việc giải thích R2 trong trường hợp hồi quy meta sẽ được đánh giá cao.


Tôi hiểu mối quan tâm của bạn, nhưng tôi nghĩ sẽ hợp lý khi có R2 cao hơn sau khi cân khi thực sự có mối quan hệ giữa kích thước hiệu ứng (ES) và kích thước của bạn.
Emilie

Câu trả lời:


10

Giá trị giả - được báo cáo được tính với: trong đó là (tổng) số lượng không đồng nhất theo ước tính dựa trên mô hình hiệu ứng ngẫu nhiên và là lượng không đồng nhất (dư) theo ước tính dựa trên mô hình hồi quy meta hiệu ứng hỗn hợp. Lưu ý rằng đây không phải là bất cứ điều gì cụ thể đối với gói - đó là cách giá trị này thường được tính trong các mô hình hồi quy meta hiệu ứng hỗn hợp.R 2 = τ 2 R E - τ 2 M ER2τ2REτ2ME

R2=τ^RE2τ^ME2τ^RE2,
τ^RE2τ^ME2metafor

Giá trị này ước tính mức độ không đồng nhất được tính toán bởi các điều hành / hiệp phương sai có trong mô hình hồi quy meta (nghĩa là giảm tỷ lệ không đồng nhất sau khi bao gồm cả điều tiết / hiệp phương sai trong mô hình). Lưu ý rằng nó không liên quan đến sự thay đổi mẫu. Do đó, hoàn toàn có thể nhận được các giá trị rất lớn , ngay cả khi vẫn có sự khác biệt giữa đường hồi quy và kích thước hiệu ứng quan sát được (khi những khác biệt đó không lớn hơn nhiều so với những gì người ta mong đợi chỉ dựa trên biến thiên lấy mẫu). Thực tế, khi (điều này chắc chắn có thể xảy ra), thìτ 2 M E = 0 R 2 = 1R2τ^ME2=0R2=1 - nhưng điều này không có nghĩa là tất cả các điểm đều nằm trên đường hồi quy (phần dư không lớn hơn dự kiến ​​dựa trên biến thiên lấy mẫu).

Bất kể, điều quan trọng là nhận ra rằng pseudo- này Thống kê không phải là rất đáng tin cậy trừ khi số nghiên cứu lớn. Xem, ví dụ, bài viết này:R2

López-López, JA, Marín-Martínez, F., Sánchez-Meca, J., Van den Noortgate, W., & Viaroubauer, W. (2014). Ước tính sức mạnh dự đoán của mô hình trong hồi quy meta hiệu ứng hỗn hợp: Một nghiên cứu mô phỏng. Tạp chí tâm lý học thống kê và toán học của Anh, 67 (1), 30 trận48.

Về bản chất, tôi sẽ không đặt quá nhiều niềm tin vào giá trị thực tế trừ khi bạn có ít nhất 30 nghiên cứu (nhưng đừng trích dẫn tôi chính xác về con số đó). Để có một bài tập hay, bạn có thể sử dụng bootstrapping để có được CI gần đúng cho . Khá nhiều tất cả những gì bạn cần biết để làm điều này được giải thích ở đây:R2

http://www.metafor-project.org/doku.php/tips:bootstrapping_with_ma

Chỉ cần thay đổi giá trị được hàm trả về boot.func()thành res$R2(và vì không có ước tính phương sai cho , bạn không thể có được các khoảng thời gian được học sinh). Trong trường hợp của bạn, có thể bạn sẽ kết thúc với một CI rất rộng (có thể kéo dài khá nhiều từ 0 đến 100%).R2


1
Tuyệt quá. Cảm ơn, điều đó rất có ý nghĩa. Tôi đã lấy mẫu lại khung dữ liệu với sự thay thế và thấy rằng 95% CI nằm trong khoảng từ 4 đến 100% được giải thích. Tôi đoán rằng rất yên tâm (nhưng không đặc biệt thú vị) rằng CI không bao gồm số không. Đây là một liều thực tế hữu ích để xem chúng ta có độ chính xác nhỏ như thế nào khi mẫu nhỏ ...........
user21879
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.