Lưu ý rằng biểu thức phương sai trong câu hỏi là một xấp xỉ. Hedges (1981) đã đưa ra phương sai mẫu lớn của d và xấp xỉ trong một thiết lập chung (nghĩa là nhiều thí nghiệm / nghiên cứu), và câu trả lời của tôi khá nhiều khi đi qua các dẫn xuất trong bài báo.
Đầu tiên, các giả định chúng ta sẽ sử dụng như sau:
Giả sử chúng ta có hai nhóm điều trị độc lập là (điều trị) và C (đối chứng). Hãy Y T i và Y C j là điểm / phản ứng / bất cứ điều gì từ đối tượng i trong nhóm T và chủ đề j trong nhóm C , tương ứng.TCYTiYCjiTjC
Chúng tôi giả định rằng các phản ứng thường được phân phối và các nhóm điều trị và kiểm soát có chung một phương sai, nghĩa là
YTiYCj∼N(μT,σ2),i=1,…nT∼N(μC,σ2),j=1,…nC
Kích thước ảnh hưởng chúng ta đang quan tâm đến việc lập dự toán trong mỗi nghiên cứu là . Ước tính kích thước hiệu lực thi hành, chúng tôi sẽ sử dụng được
d= ˉ Y T- ˉ Y Cδ=μT−μCσ
trong đóS2klà phương sai mẫu không thiên vị cho nhómk.
d=Y¯T−Y¯C(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√
S2kk
Hãy xem xét các thuộc tính mẫu lớn của . d
Đầu tiên, lưu ý rằng:
và (lỏng lẻo với ký hiệu của tôi):
( n T - 1 ) S 2 T
Y¯T−Y¯C∼N(μT−μC,σ2nT+nCnTnC)
và
(nC-1)S 2 C(nT−1)S2Tσ2(nT+nC−2)=1nT+nC−2(nT−1)S2Tσ2∼1nT+nC−2χ2nT−1(1)
(nC−1)S2Cσ2(nT+nC−2)=1nT+nC−2(nC−1)S2Cσ2∼1nT+nC−2χ2nC−1(2)
Phương trình (1) và (2) dẫn đến thực tế là (một lần nữa, lỏng lẻo với ký hiệu của tôi):
1σ2(nT−1)S2T+(nC−1)S2CnT+nC−2∼1nT+nC−2χ2nT+nC−2
d=Y¯T−Y¯C(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√=(σnT+nCnTnC−−−−−√)−1(Y¯T−Y¯C)(σnT+nCnTnC−−−−−√)−1(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√=(Y¯T−Y¯C)−(μT−μC)σnT+nCnTnC√+μT−μCσnT+nCnTnC√(nT+nCnTnC−−−−−√)−1(nT−1)S2T+(nC−1)S2Cσ2(nT+nC−2)−−−−−−−−−−−−−√=nT+nCnTnC−−−−−−−√⎛⎝⎜θ+δnTnCnT+nC−−−−−√Vν−−√⎞⎠⎟
where
θ∼N(0,1),
V∼χ2ν, and
ν=nT+nC−2. Thus,
d is
nT+nCnTnC−−−−−√ times a variable which follows a non-central t-distribution with
nT+nC−2 degrees of freedom and non-centrality parameter of
δnTnCnT+nC−−−−−√.
Using the moment properties of the non-central t distribution, it follows that:
Var(d)=(nT+nC−2)(nT+nC−4)(nT+nC)nTnC(1+δ2nTnCnT+nC)−δ2b2(3)
where
b=Γ(nT+nC−22)nT+nC−22−−−−−−−√Γ(nT+nC−32)≈1−34(nT+nC−2)−1
So Equation (3) provides the exact large sample variance. Note that an unbiased estimator for δ is bd, with variance:
Var(bd)=b2(nT+nC−2)(nT+nC−4)(nT+nC)nTnC(1+δ2nTnCnT+nC)−δ2
For large degrees of freedom (i.e. large nT+nC−2), the variance of a non-central t variate with ν degrees of freedom and non-centrality parameter p can be approximated by 1+p22ν (Johnson, Kotz, Balakrishnan, 1995). Thus, we have:
Var(d)≈nT+nCnTnC⎛⎝⎜1+δ2(nTnCnT+nC)2(nT+nC−2)⎞⎠⎟=nT+nCnTnC+δ22(nT+nC−2)
Plug in our estimator for δ and we're done.