Định nghĩa thời gian tự tương quan (đối với cỡ mẫu hiệu quả)


23

Tôi đã tìm thấy hai định nghĩa trong tài liệu về thời gian tự tương quan của chuỗi thời gian đứng yên yếu:

τmột= =1+2Σk= =1ρkđấu vớiτb= =1+2Σk= =1|ρk|

trong đó là tự động tương quan ở độ trễ . ρk= =Cov[Xt,Xt+h]Var[Xt]k

Một ứng dụng của thời gian tự tương quan là tìm "cỡ mẫu hiệu quả": nếu bạn có quan sát của chuỗi thời gian và bạn biết thời gian tự tương quan của nó , thì bạn có thể giả vờ rằng bạn cónτ

nhiệu= =nτ

mẫu độc lập thay vì mẫu tương quan cho mục đích tìm giá trị trung bình. Ước tính từ dữ liệu là không tầm thường, nhưng có một vài cách để làm điều đó (xem Thompson 2010 ).τnτ

Định nghĩa không có giá trị tuyệt đối, , dường như phổ biến hơn trong tài liệu; nhưng nó thừa nhận khả năng của . Sử dụng R và gói "coda":τ a < 1τmộtτmột<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Hàm " " trong "coda" sử dụng định nghĩa về thời gian tự tương quan tương đương với , ở trên. Có một số gói R khác ra khỏi đó mà tính toán hiệu quả mẫu kích thước hoặc tự tương quan thời gian, và tất cả những người tôi đã cố gắng kết quả này cho phù hợp với điều này: đó là một AR (1) quá trình với một hệ số tiêu cực AR có nhiều mẫu có hiệu quả hơn so với tương quan chuỗi thời gian. Điều này có vẻ lạ. τmột

Rõ ràng, điều này không bao giờ có thể xảy ra trong định nghĩa về thời gian tự tương quan.τb

Định nghĩa chính xác của thời gian tự tương quan là gì? Có điều gì đó sai với sự hiểu biết của tôi về kích thước mẫu hiệu quả? Kết quả hiển thị ở trên có vẻ như nó phải sai ... chuyện gì đang xảy ra?nhiệu>n


Chỉ để đảm bảo rằng tôi đã không hiểu nhầm không phải là thay vì ? hCov(Xt,Xt+k)h
sachinruk

2
Tôi quan tâm đến định nghĩa thứ hai, tức là, . Bạn có thể cung cấp tài liệu nơi bạn tìm thấy nó? τb
Harry

Câu trả lời:


17

Đầu tiên, định nghĩa thích hợp về "cỡ mẫu hiệu quả" là IMO được liên kết với một câu hỏi khá cụ thể. Nếu được phân phối hệt với trung bình μ và phương sai 1 giá trị trung bình thực nghiệm μ = 1X1,X2,Giáo dụcμ

μ^= =1nΣk= =1nXk
μn-1μ^
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neffneff=n/τa

n1neff>n


2
Đối với bất kỳ ai muốn biết thêm về việc sử dụng mối tương quan tiêu cực trong mô phỏng Monte Carlo, hãy thử googling "biến thể phản kháng". Thông tin thêm trong ghi chú khóa học ở đây hoặc ở đây .
andrewtinka

1

xem http://arxiv.org/pdf/1403.5536v1.pdf

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

cho cỡ mẫu hiệu quả. Tôi nghĩ rằng công thức thay thế sử dụng tỷ lệ phương sai mẫu và phương sai chuỗi Markov không triệu chứng thông qua trung bình lô là công cụ ước tính phù hợp hơn.


4
Bạn có thể mở rộng về nội dung trong các liên kết đó? Vì nó đứng, sthis là quá ngắn để trả lời theo tiêu chuẩn của chúng tôi!
kjetil b halvorsen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.