Trung bình


10

Tôi cần phải đạt được một số loại "trung bình" trong danh sách các phương sai, nhưng gặp khó khăn khi đưa ra giải pháp hợp lý. Có một cuộc thảo luận thú vị về sự khác biệt giữa ba phương tiện Pythagore (số học, hình học và hài hòa) trong chủ đề này ; tuy nhiên, tôi vẫn không cảm thấy bất kỳ ai trong số họ sẽ là một ứng cử viên tốt. Bất kỳ đề xuất?

PS Một số bối cảnh - Những phương sai này là phương sai mẫu từ đối tượng, mỗi đối tượng đều trải qua cùng một thiết kế thử nghiệm với cùng cỡ mẫu k . Nói cách khác, có rất n mẫu phương sai σ 2 1 , σ 2 2 , ..., σ 2 n , tương ứng với những n đối tượng. Một phân tích tổng hợp đã được thực hiện ở cấp độ dân số. Lý do tôi cần có được một số loại phương sai mẫu "trung bình" hoặc "tóm tắt" là tôi muốn sử dụng nó để tính toán một chỉ số như ICC sau khi phân tích tổng hợp.nknσ12σ22σn2n

PPS Để giữ cho cuộc thảo luận cụ thể hơn, hãy để tôi giải thích vấn đề bằng ví dụ sau trong R:

library(metafor)
dat <- get(data(dat.konstantopoulos2011))
dat$district <- as.factor(dat$district)
dat$school <- as.factor(dat$school)

Trong bộ dữ liệu có một phương sai liên quan đến điểm thành tích của mỗi trường:

str(dat)
Classes ‘escalc’ and 'data.frame':  56 obs. of  6 variables:
 $ district: Factor w/ 11 levels "11","12","18",..: 1 1 1 1 2 2 2 2 3 3 ...
 $ school  : Factor w/ 11 levels "1","2","3","4",..: 1 2 3 4 1 2 3 4 1 2 ...
 $ year    : int  1976 1976 1976 1976 1989 1989 1989 1989 1994 1994 ...
 $ yi      : atomic  -0.18 -0.22 0.23 -0.3 0.13 -0.26 0.19 0.32 0.45 0.38 ...
 $ vi      : num  0.118 0.118 0.144 0.144 0.014 0.014 0.015 0.024 0.023 0.043 ...

Giả sử rằng chúng tôi thực hiện phân tích meta với mô hình phân cấp hoặc hiệu ứng hỗn hợp:

yij=a+αi+βj+ϵij

Trong đó β j là các hiệu ứng ngẫu nhiên cho trường thứ i và quận thứ j , và ϵ i j là lỗi đo lường với phân phối Gaussian đã biết N ( 0 , v i j ) . Mô hình này có thể được phân tích như sau:αiβjijϵijN(0,vij)

(fm <- rma.mv(yi, vi, random = list(~1 | district, ~1 | school), data=dat)) 

hiển thị các ước tính phương sai sau cho hai thành phần phương sai:

Multivariate Meta-Analysis Model (k = 56; method: REML)
Variance Components: 

            estim    sqrt  nlvls  fixed    factor
sigma^2.1  0.0814  0.2853     11     no  district
sigma^2.2  0.0010  0.0308     11     no    school

Hai phương sai trong kết quả, sigma ^ 2.1 và sigma ^ 2.2, tương ứng với hai biến hiệu ứng ngẫu nhiên (quận và trường).

vijϵij

Var(yij)=Var(αi+βj+ϵij)=σ12+σ22+vij

Cách tiếp cận ban đầu (và đơn giản) của tôi là chỉ sử dụng trung bình số học:

σ12σ12+σ22+mean(vij)

mean(vij)


4
Bối cảnh là tất cả mọi thứ ở đây. Là những phương sai lý thuyết (khoảnh khắc phân phối), hay phương sai mẫu? Nếu chúng là phương sai mẫu, mối quan hệ giữa các mẫu là gì? Họ đến từ cùng một dân số? Nếu có, bạn có sẵn kích thước của từng mẫu không? Nếu các mẫu không đến từ cùng một quần thể, làm thế nào để bạn biện minh trung bình cho các phương sai?
Alecos Papadopoulos

2
Mô hình phân cấp là một câu trả lời rất linh hoạt. Bài đăng blog này trên tám trường là một khởi đầu tốt. andrewgelman.com/2014/01/21/ Nhật Gelman và cộng sự, Phân tích dữ liệu Bayes là một nơi tuyệt vời để có thêm thông tin.
Sycorax nói phục hồi Monica


1
Đây có phải là một vấn đề XY? Bạn có muốn biết làm thế nào để trung bình phương sai ... Hoặc bạn có muốn biết cách tính ICC để phân tích tổng hợp không?
Đánh dấu

1
Trong trường hợp đó, số liệu thống kê này.stackexchange.com/questions / 186197 / Bài đăng có giúp được gì không?
mdewey

Câu trả lời:


7

Mở rộng các ý kiến ​​mà bạn nhận được, câu trả lời cho câu hỏi trong tiêu đề của bạn đã được đưa ra trong Làm thế nào để 'tổng hợp' một độ lệch chuẩn? và đọc như sau: để có độ lệch chuẩn trung bình, đầu tiên lấy trung bình của phương sai và sau đó lấy căn bậc hai của nó.

n×knk

Thực tế lưu ý rằng các công thức hiện đại của ICC trên thực tế xác định nó theo các mô hình hiệu ứng hỗn hợp như mô tả ở trên, do đó, việc sử dụng mô hình đó giải quyết được nhiều vấn đề cho bạn và nó thường là cách tiếp cận được đề xuất để phân tích tổng hợp (nhưng lưu ý rằng ICC có thể bị đánh lừa ).


Về chỉnh sửa của bạn, nếu mô hình của bạn là

yij=a+αi+βj+ϵij

αiN(μα,σα2)βjN(μβ,σβ2)ϵijN(0,σϵ2)

ICCα=σα2σα2+σβ2+σϵ2

α,βϵα

(...) mối tương quan nội bộ sẽ chỉ là một phần của tổng phương sai do nguyên nhân mà các quan sát trong cùng một lớp có điểm chung.

Vì vậy, tử số trong công thức ICC là phương sai của hiệu ứng lãi suất và mẫu số là tổng phương sai. Lưu ý rằng giá trị trung bình của phương sai không liên quan gì đến tổng phương sai (tổng phương sai), vì vậy trừ khi tôi hiểu sai điều gì đó, tôi không thể hiểu tại sao ý nghĩa của bạn lại quan tâm ở đây.


Tôi thực sự đánh giá cao câu trả lời và tất cả các ý kiến ​​trên! Tôi chỉ cần thêm một phần tái bút trong bài viết gốc để làm rõ hơn vấn đề. Tôi phải thừa nhận rằng tôi không quá quen thuộc với phương pháp Bayes. Nếu vấn đề có thể được mô tả rõ hơn theo mô hình Bayes, vui lòng giải thích thêm một chút với tập dữ liệu mẫu mà tôi vừa trình bày trong phần tái bút. Cảm ơn!
bluepole

@bluepole Bạn không cần mô hình Bayes. Mô hình hiệu ứng hỗn hợp truyền thống sẽ hoạt động tốt. Các mô hình Bayes thường linh hoạt hơn cho các vấn đề như vậy.
Tim

Vì vậy, đối với tập dữ liệu mẫu được thêm vào trong bài viết gốc của tôi, bạn có nghĩ rằng ý nghĩa số học là hợp lý trong ngữ cảnh không?
bluepole

ϵijN(0,σij2)N(0,σϵ2)σij2σϵ2

ϵijN(0,σij2)σij2iσij2/ijσij2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.