Tôi đã tìm thấy hai định nghĩa trong tài liệu về thời gian tự tương quan của chuỗi thời gian đứng yên yếu:
trong đó là tự động tương quan ở độ trễ .
Một ứng dụng của thời gian tự tương quan là tìm "cỡ mẫu hiệu quả": nếu bạn có quan sát của chuỗi thời gian và bạn biết thời gian tự tương quan của nó , thì bạn có thể giả vờ rằng bạn có
mẫu độc lập thay vì mẫu tương quan cho mục đích tìm giá trị trung bình. Ước tính từ dữ liệu là không tầm thường, nhưng có một vài cách để làm điều đó (xem Thompson 2010 ).τ
Định nghĩa không có giá trị tuyệt đối, , dường như phổ biến hơn trong tài liệu; nhưng nó thừa nhận khả năng của . Sử dụng R và gói "coda":τ a < 1
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
Hàm " " trong "coda" sử dụng định nghĩa về thời gian tự tương quan tương đương với , ở trên. Có một số gói R khác ra khỏi đó mà tính toán hiệu quả mẫu kích thước hoặc tự tương quan thời gian, và tất cả những người tôi đã cố gắng kết quả này cho phù hợp với điều này: đó là một AR (1) quá trình với một hệ số tiêu cực AR có nhiều mẫu có hiệu quả hơn so với tương quan chuỗi thời gian. Điều này có vẻ lạ.
Rõ ràng, điều này không bao giờ có thể xảy ra trong định nghĩa về thời gian tự tương quan.
Định nghĩa chính xác của thời gian tự tương quan là gì? Có điều gì đó sai với sự hiểu biết của tôi về kích thước mẫu hiệu quả? Kết quả hiển thị ở trên có vẻ như nó phải sai ... chuyện gì đang xảy ra?