Đầu tiên một số ký hiệu. Đặt và biểu thị chuỗi phân loại được liên kết với và , tức là . Đặt . Hãy xem xét các binerifying started
trong đó là Delta của Kronecker. Vì vậy chúng tôi có{Xt}1,…,m{Yt}1,…,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m
X∗iY∗i=(X∗1,i,…,X∗N,i)=(δi,X1,…,δi,Xn,0,…,0)=(Y∗1,i,…,Y∗N,i)=(0,…,0,δi,Y1,…,δi,Yn)
δi,j≡1i=jXm,i=∑t=1NX∗t,i=∑t=1mδi,XtYn,i=∑t=1NY∗t,i=∑t=1nδi,Yt
Bây giờ chúng ta bắt đầu bằng chứng. Đầu tiên chúng tôi kết hợp hai triệu tập của thống kê kiểm tra. Lưu ý rằng
Vì vậy, chúng tôi có thể viết thống kê kiểm tra là
Xm,i−mc^iYn,i−nc^i=(n+m)Xm,i−m(Xm,i+Yn,i)n+m=nXm,i−mYn,in+m=(n+m)Yn,i−n(Xm,i+Yn,i)n+m=mYn,i−nXm,in+m
S=∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i=∑i=1k(nXm,i−mYn,i)2(n+m)2mc^i+∑i=1k(nXm,i−mYn,i)2(n+m)2nc^i=∑i=1k(nXm,i−mYn,i)2nm(n+m)c^i
Lưu ý tiếp theo rằng
với các thuộc tính sau
nXm,i−mYn,i=∑t=1NnX∗t,i−mY∗t,i=Zi
E[Zi]Var[Zi]Cov[Zi,Zj]=nE[Xm,i]−mE[Yn,i]=nmai−nmai=0=Var[nXm,i−mYn,i]=n2Var[Xm,i]−m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1−ai)+m2nai(1−ai)=nm(n+m)ai(1−ai)=E[ZiZj]−E[Zi]E[Zj]=E[(nXm,i−mYn,i)(nXm,j−mYn,j)]=n2(−maiaj+m2aiaj)−2n2m2aiaj+m2(−naiaj+n2aiaj)=−nm(n+m)aiaj
và do CLT đa biến, chúng ta có trong đó phần tử của , . Vì Bởi Slutsky, chúng ta có trong đó là ma trận danh tính ,
1nm(n+m)−−−−−−−−−√Z=nXm−mYnnm(n+m)−−−−−−−−−√→DN(0,Σ)
(i,j)Σσij=ai(δij−aj)c^=(c^1,…,c^k)→p(a1,…,ak)=anXm−mYnnm(n+m)−−−−−−−−−√c^→DN(0,Ik−a−−√a−−√′)
Ikk×ka−−√=(a1−−√,…,ak−−√) . Vì có eigenvalue 0 của bội số 1 và eigenvalue 1 của bội số , theo định lý ánh xạ liên tục (hoặc xem Bổ đề 17.1, Định lý 17.2 của van der Vaart) chúng ta có
Ik−a−−√a−−√′k−1∑i=1k(nXm,i−mYn,i)2nm(n+m)c^i→Dχ2k−1