Văn phòng phẩm thứ hai yếu hơn văn phòng phẩm nghiêm ngặt. Văn phòng phẩm thứ hai yêu cầu rằng khoảnh khắc thứ tự thứ nhất và thứ hai (trung bình, phương sai và hiệp phương sai) không đổi trong suốt thời gian và do đó, không phụ thuộc vào thời gian mà quá trình được quan sát. Cụ thể, như bạn nói, hiệp phương sai chỉ phụ thuộc vào thứ tự độ trễ, , chứ không phụ thuộc vào thời gian đo, cho tất cả .C o v ( x t , x t - k ) = C o v ( x t + h , x t + h - k ) tkCov(xt,xt−k)=Cov(xt+h,xt+h−k)t
Trong một quy trình ổn định nghiêm ngặt, các khoảnh khắc của tất cả các đơn đặt hàng không đổi trong suốt thời gian, nghĩa là, như bạn nói, phân phối chung của giống như khớp phân phối cho tất cả và . X t 1 + k + X t 2 + k + . . . + X t m + k t 1 , t 2 , . . . , t m kXt1,Xt2,...,XtmXt1+k+Xt2+k+...+Xtm+kt1,t2,...,tmk
Do đó, văn phòng phẩm nghiêm ngặt liên quan đến văn phòng phẩm thứ hai nhưng điều ngược lại là không đúng.
Chỉnh sửa (được chỉnh sửa dưới dạng câu trả lời cho nhận xét của @ whuber)
Các tuyên bố trước đây là sự hiểu biết chung về văn phòng phẩm yếu và mạnh. Mặc dù ý kiến cho rằng sự đứng yên trong ý nghĩa yếu không bao hàm sự đứng yên theo nghĩa mạnh mẽ hơn có thể đồng ý với trực giác, nhưng nó có thể không đơn giản để chứng minh, như được chỉ ra bởi người viết trong bình luận dưới đây. Nó có thể hữu ích để minh họa ý tưởng như được đề xuất trong bình luận đó.
Làm thế nào chúng ta có thể định nghĩa một quá trình đứng yên bậc hai (trung bình, phương sai và hiệp phương sai trong suốt thời gian) nhưng nó không ổn định theo nghĩa chặt chẽ (những khoảnh khắc của bậc cao hơn phụ thuộc vào thời gian)?
Theo đề xuất của @whuber (nếu tôi hiểu chính xác), chúng ta có thể ghép các lô quan sát đến từ các bản phân phối khác nhau. Chúng ta chỉ cần cẩn thận rằng các phân phối đó có cùng giá trị trung bình và phương sai (tại thời điểm này chúng ta hãy xem xét rằng chúng được lấy mẫu độc lập với nhau). Một mặt, chúng ta có thể ví dụ như tạo ra những quan sát từ sinh viên -distribution với bậc tự do. Giá trị trung bình bằng 0 và phương sai là . Mặt khác, chúng ta có thể lấy phân phối Gaussian với giá trị trung bình bằng không và phương sai .5 5 / ( 5 - 2 ) = 5 / 3 5 / 3t55/(5−2)=5/35/3
Cả hai phân phối đều có chung giá trị trung bình (không) và phương sai ( ). Do đó, việc kết hợp các giá trị ngẫu nhiên từ các phân phối này, ít nhất sẽ là văn phòng phẩm thứ hai. Tuy nhiên, nhọn tại các điểm chi phối bởi sự phân bố Gaussian sẽ , trong khi tại các điểm thời gian mà các dữ liệu đến từ các sinh viên -distribution nó sẽ là . Do đó, dữ liệu được tạo theo cách này không ổn định theo nghĩa nghiêm ngặt vì các khoảnh khắc của bậc bốn không phải là hằng số.5/33t3+6/(5−4)=9
Hiệp phương sai cũng không đổi và bằng 0, vì chúng tôi đã xem xét các quan sát độc lập. Điều này có vẻ tầm thường, vì vậy chúng ta có thể tạo ra một số sự phụ thuộc giữa các quan sát theo mô hình tự phát sau đây.
yt=ϕyt−1+ϵt,|ϕ|<1,t=1,2,...,120
với
ϵt∼{N(0,σ2=5/3)t5ift∈[0,20],[41,60],[81,100]ift∈[21,40],[61,80],[101,120].
|ϕ|<1 đảm bảo rằng văn phòng phẩm thứ hai được thỏa mãn.
Chúng ta có thể mô phỏng một số chuỗi này trong phần mềm R và kiểm tra xem trung bình mẫu, phương sai, hiệp phương sai thứ nhất và kurtosis không đổi trong các lô quan sát (mã dưới đây sử dụng và cỡ mẫu , Hình hiển thị một trong các chuỗi mô phỏng):φ = 0,8 n = 24020ϕ=0.8n=240
# this function is required below
kurtosis <- function(x)
{
n <- length(x)
m1 <- sum(x)/n
m2 <- sum((x - m1)^2)/n
m3 <- sum((x - m1)^3)/n
m4 <- sum((x - m1)^4)/n
b1 <- (m3/m2^(3/2))^2
(m4/m2^2)
}
# begin simulation
set.seed(123)
n <- 240
Mmeans <- Mvars <- Mcovs <- Mkurts <- matrix(nrow = 1000, ncol = n/20)
for (i in seq(nrow(Mmeans)))
{
eps1 <- rnorm(n = n/2, sd = sqrt(5/3))
eps2 <- rt(n = n/2, df = 5)
eps <- c(eps1[1:20], eps2[1:20], eps1[21:40], eps2[21:40], eps1[41:60], eps2[41:60],
eps1[61:80], eps2[61:80], eps1[81:100], eps2[81:100], eps1[101:120], eps2[101:120])
y <- arima.sim(n = n, model = list(order = c(1,0,0), ar = 0.8), innov = eps)
ly <- split(y, gl(n/20, 20))
Mmeans[i,] <- unlist(lapply(ly, mean))
Mvars[i,] <- unlist(lapply(ly, var))
Mcovs[i,] <- unlist(lapply(ly, function(x)
acf(x, lag.max = 1, type = "cov", plot = FALSE)$acf[2,,1]))
Mkurts[i,] <- unlist(lapply(ly, kurtosis))
}
Kết quả không như tôi mong đợi:
round(colMeans(Mmeans), 4)
# [1] 0.0549 -0.0102 -0.0077 -0.0624 -0.0355 -0.0120 0.0191 0.0094 -0.0384
# [10] 0.0390 -0.0056 -0.0236
round(colMeans(Mvars), 4)
# [1] 3.0430 3.0769 3.1963 3.1102 3.1551 3.2853 3.1344 3.2351 3.2053 3.1714
# [11] 3.1115 3.2148
round(colMeans(Mcovs), 4)
# [1] 1.8417 1.8675 1.9571 1.8940 1.9175 2.0123 1.8905 1.9863 1.9653 1.9313
# [11] 1.8820 1.9491
round(colMeans(Mkurts), 4)
# [1] 2.4603 2.5800 2.4576 2.5927 2.5048 2.6269 2.5251 2.5340 2.4762 2.5731
# [11] 2.5001 2.6279
Giá trị trung bình, phương sai và hiệp phương sai tương đối ổn định giữa các lô như mong đợi cho một quy trình đứng yên thứ hai. Tuy nhiên, kurtosis vẫn tương đối ổn định là tốt. Chúng ta có thể mong đợi giá trị cao hơn của nhọn vào những lô liên quan đến thu hút từ các sinh viên -distribution. Có thể quan sát là không đủ để nắm bắt những thay đổi trong kurtosis. Nếu chúng tôi không biết quy trình tạo dữ liệu của các chuỗi này và chúng tôi đã xem xét các số liệu thống kê, có lẽ chúng tôi sẽ kết luận rằng chuỗi đó đứng yên ít nhất là thứ tư. Hoặc tôi đã không lấy ví dụ đúng hoặc một số tính năng của loạt được che dấu cho kích thước mẫu này.20t20