Tự động sửa
Mối tương quan giữa hai biến y1,y2 được định nghĩa là:
ρ=E[(y1−μ1)(y2−μ2)]σ1σ2=Cov(y1,y2)σ1σ2,
trong đó E là các nhà điều hành kỳ vọng, μ1 và μ2 là phương tiện tương ứng cho y1 và y2 và σ1,σ2 là độ lệch chuẩn của họ.
Trong ngữ cảnh của một biến duy nhất, tức là tự động sửa lỗi, y1 là chuỗi gốc và y2 là phiên bản bị trễ của nó. Theo định nghĩa trên, tự động tương quan mẫu của thứ tự k=0,1,2,...có thể thu được bằng cách tính biểu thức sau với chuỗi quan sát yt , t=1,2,...,n :
ρ(k)=1n−k∑nt=k+1(yt−y¯)(yt−k−y¯)1n∑nt=1(yt−y¯)2−−−−−−−−−−−−−√1n−k∑nt=k+1(yt−k−y¯)2−−−−−−−−−−−−−−−−−−√,
Trong đó y¯ là giá trị trung bình mẫu của dữ liệu.
Tự kỷ một phần
Tự động tương quan một phần đo lường sự phụ thuộc tuyến tính của một biến sau khi loại bỏ ảnh hưởng của (các) biến khác ảnh hưởng đến cả hai biến. Ví dụ, tự động tương quan một phần của trật tự đo lường hiệu ứng (phụ thuộc tuyến tính) của yt−2 trên yt sau khi loại bỏ ảnh hưởng của yt−1 trên cả yt và yt−2 .
Mỗi tự động tương quan một phần có thể thu được dưới dạng một loạt hồi quy có dạng:
y~t=ϕ21y~t−1+ϕ22y~t−2+et,
trong đó y~t là chuỗi gốc trừ trung bình mẫu, yt−y¯ . Ước tính ϕ22 sẽ cho giá trị tự động tương quan một phần của đơn hàng 2. Mở rộng hồi quy với k trễ bổ sung, ước tính của thuật ngữ cuối cùng sẽ đưa ra tự động tương quan một phần của đơn hàng k .
An alternative way to compute the sample partial autocorrelations is by solving the following system for each order k:
⎛⎝⎜⎜⎜⎜ρ(0)ρ(1)⋮ρ(k−1)ρ(1)ρ(0)⋮ρ(k−2)⋯⋯⋮⋯ρ(k−1)ρ(k−2)⋮ρ(0)⎞⎠⎟⎟⎟⎟⎛⎝⎜⎜⎜⎜ϕk1ϕk2⋮ϕkk⎞⎠⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜ρ(1)ρ(2)⋮ρ(k)⎞⎠⎟⎟⎟⎟,
where ρ(⋅) are the sample autocorrelations. This mapping between the sample autocorrelations and the partial autocorrelations is known as the
Durbin-Levinson recursion.
This approach is relatively easy to implement for illustration. For example, in the R software, we can obtain the partial autocorrelation of order 5 as follows:
# sample data
x <- diff(AirPassengers)
# autocorrelations
sacf <- acf(x, lag.max = 10, plot = FALSE)$acf[,,1]
# solve the system of equations
res1 <- solve(toeplitz(sacf[1:5]), sacf[2:6])
res1
# [1] 0.29992688 -0.18784728 -0.08468517 -0.22463189 0.01008379
# benchmark result
res2 <- pacf(x, lag.max = 5, plot = FALSE)$acf[,,1]
res2
# [1] 0.30285526 -0.21344644 -0.16044680 -0.22163003 0.01008379
all.equal(res1[5], res2[5])
# [1] TRUE
Confidence bands
Confidence bands can be computed as the value of the sample autocorrelations ±z1−α/2n√, where z1−α/2 is the quantile 1−α/2 in the Gaussian distribution, e.g. 1.96 for 95% confidence bands.
Sometimes confidence bands that increase as the order increases are used.
In this cases the bands can be defined as ±z1−α/21n(1+2∑ki=1ρ(i)2)−−−−−−−−−−−−−−−−√.