Giả sử rằng chúng tôi chỉ định một mô hình AR (1) đơn giản, với tất cả các thuộc tính thông thường,
yt=βyt−1+ut
Biểu thị hiệp phương sai lý thuyết của thuật ngữ lỗi là
γj≡E(utut−j)
Nếu chúng ta có thể quan sát thuật ngữ lỗi, thì tự động tương quan mẫu của thuật ngữ lỗi được xác định là
ρ~j≡γ~jγ~0
Ở đâu
γ~j≡1n∑t=j+1nutut−j,j=0,1,2...
Nhưng trong thực tế, chúng tôi không quan sát thuật ngữ lỗi. Vì vậy, tự động tương quan mẫu liên quan đến thuật ngữ lỗi sẽ được ước tính bằng cách sử dụng phần dư từ ước tính, như
γ^j≡1n∑t=j+1nu^tu^t−j,j=0,1,2...
Thống kê Q của Box-Pierce (Ljung-Box Q chỉ là phiên bản thu nhỏ trung tính không có triệu chứng của nó) là
QBP=n∑j=1pρ^2j=∑j=1p[n−−√ρ^j]2→d???χ2(p)
Vấn đề của chúng tôi là chính xác liệu có thể được cho là có phân phối không bình phương (dưới giá trị không có tự động trong thuật ngữ lỗi) trong mô hình này hay không.
Đối với điều này xảy ra, mỗi và tất cả mọi người của √QBP
phải tiệm tiêu chuẩn bình thường. Một cách để kiểm tra này là để kiểm tra xem liệu √n−−√ρ^j có sự phân bố tiệm cận tương tự như √n−−√ρ^ (được xây dựng bằng cách sử dụng lỗi thật, và do đó có hành vi tiệm cận mong muốn dưới null).n−−√ρ~
Chúng tôi có điều đó
u^t=yt−β^yt−1=ut−(β^−β)yt−1
nơi β là một ước lượng phù hợp. Vì thếβ^
γ^j≡1n∑t=j+1n[ut−(β^−β)yt−1][ut−j−(β^−β)yt−j−1]
=γ~j−1n∑t=j+1n(β^−β)[utyt−j−1+ut−jyt−1]+1n∑t=j+1n(β^−β)2yt−1yt−j−1
Mẫu được giả định là đứng yên và ergodic, và các khoảnh khắc được giả sử tồn tại cho đến khi có thứ tự mong muốn. Kể từ khi ước lượng β là phù hợp, điều này là đủ cho hai khoản tiền để đi đến số không. Vì vậy, chúng tôi kết luậnβ^
γ^j→pγ~j
Điều này ngụ ý rằng
ρ^j→pρ~j→pρj
Nhưng điều này không tự động đảm bảo rằng hội tụ để √n−−√ρ^jn−−√ρ~jn
n−−√γ^j→dn−−√γ~j
γ0
Chúng ta có
n−−√γ^j=n−−√γ~j−1n∑t=j+1nn−−√(β^−β)[utyt−j−1+ut−jyt−1]+1n∑t=j+1nn−−√(β^−β)2yt−1yt−j−1
So the question is : do these two sums, multiplied now by n−−√, go to zero in probability so that we will be left with n−−√γ^j=n−−√γ~j asymptotically?
For the second sum we have
1n∑t=j+1nn−−√(β^−β)2yt−1yt−j−1=1n∑t=j+1n[n−−√(β^−β)][(β^−β)yt−1yt−j−1]
Since [n−−√(β^−β)] converges to a random variable, and β^ is consistent, this will go to zero.
For the first sum, here too we have that [n−−√(β^−β)] converges to a random variable, and so we have that
1n∑t=j+1n[utyt−j−1+ut−jyt−1]→pE[utyt−j−1]+E[ut−jyt−1]
The first expected value, E[utyt−j−1] is zero by the assumptions of the standard AR(1) model. But the second expected value is not, since the dependent variable depends on past errors.
So n−−√ρ^j won't have the same asymptotic distribution as n−−√ρ~j. But the asymptotic distribution of the latter is standard Normal, which is the one leading to a chi-squared distribution when squaring the r.v.
Therefore we conclude, that in a pure time series model, the Box-Pierce Q and the Ljung-Box Q statistic cannot be said to have an asymptotic chi-square distribution, so the test loses its asymptotic justification.
This happens because the right-hand side variable (here the lag of the dependent variable) by design is not strictly exogenous to the error term, and we have found that such strict exogeneity is required for the BP/LB Q-statistic to have the postulated asymptotic distribution.
Here the right-hand-side variable is only "predetermined", and the Breusch-Pagan test is then valid. (for the full set of conditions required for an asymptotically valid test, see Hayashi 2000, p. 146-149).