Toán học cần thiết để có được một kết quả chính xác là lộn xộn, nhưng chúng ta có thể lấy được một giá trị chính xác cho hệ số tương quan bình phương dự kiến tương đối không đau. Nó giúp giải thích tại sao một giá trị gần tiếp tục hiển thị và tại sao tăng độ dài n của bước đi ngẫu nhiên sẽ không thay đổi điều này.1 / 2n
Có khả năng nhầm lẫn về các điều khoản tiêu chuẩn. Mối tương quan tuyệt đối được đề cập trong câu hỏi, cùng với các số liệu thống kê tạo nên nó - phương sai và hiệp phương sai - là các công thức mà người ta có thể áp dụng cho bất kỳ cặp thực hiện bước đi ngẫu nhiên nào. Câu hỏi liên quan đến những gì xảy ra khi chúng ta nhìn vào nhiều nhận thức độc lập. Đối với điều đó, chúng ta cần phải kỳ vọng vào quá trình đi bộ ngẫu nhiên.
(Chỉnh sửa)
Trước khi chúng tôi tiến hành, tôi muốn chia sẻ một số hiểu biết về đồ họa với bạn. Một cặp bước đi ngẫu nhiên độc lập là một bước đi ngẫu nhiên theo hai chiều. Chúng ta có thể vẽ đường dẫn từ từng bước ( X t , Y t ) đến X t + 1 , Y t + 1 . Nếu đường dẫn này có xu hướng đi xuống (từ trái sang phải, được vẽ trên các trục XY thông thường) thì để nghiên cứu giá trị tuyệt đối của mối tương quan , hãy phủ nhận tất cả các giá trị Y. Vẽ các bước đi trên các trục có kích thước để cung cấp cho X và( X, Y)( Xt, Yt)Xt + 1, Yt + 1YX giá trị tương đương với độ lệch chuẩn và chồng các bình phương nhỏ nhất phù hợp của Y để X . Độ dốc của các đường này sẽ là giá trị tuyệt đối của các hệ số tương quan, luôn nằm trong khoảng từ 0 đến 1 .YYX01
Hình này cho thấy bước đi như vậy, mỗi chiều dài 960 (với sự khác biệt Tiêu chuẩn thông thường). Vòng tròn nhỏ mở đánh dấu điểm bắt đầu của họ. Quầng thâm đánh dấu vị trí cuối cùng của chúng.15960
Những sườn dốc có xu hướng khá lớn. Các biểu đồ tán xạ ngẫu nhiên hoàn hảo của nhiều điểm này sẽ luôn có độ dốc rất gần với không. Nếu chúng ta phải mô tả các mô hình nổi lên ở đây, chúng ta có thể nói rằng hầu hết các bước đi ngẫu nhiên 2D dần dần di chuyển từ vị trí này sang vị trí khác. (Tuy nhiên, đây không nhất thiết là vị trí điểm bắt đầu và điểm cuối của họ!) Khoảng một nửa thời gian, sau đó, sự di chuyển đó xảy ra theo hướng chéo - và độ dốc tương ứng cao.
Phần còn lại của bài viết này phác họa một phân tích về tình huống này.
( Xtôi)( W1, W2, ... , Wn)Wtôiσ2
x = ( x1, Lọ , xn)
V( x ) = 1n∑ ( xtôi- x¯)2.
Một cách hay để tính giá trị này là lấy một nửa trung bình của tất cả các khác biệt bình phương:
V( x ) = 1n ( n - 1 )Σj > tôi( xj- xtôi)2.
xXn
E (V( X) ) = 1n ( n - 1 )Σj > tôiE ( Xj- Xtôi)2.
Sự khác biệt là tổng của các biến iid,
Xj- Xtôi= Wtôi + 1+ Wtôi + 2+ ⋯ + Wj.
WkWkσ2
E (( Wtôi + 1+ Wtôi + 2+ ⋯ + W2j) ) = ( J - i ) σ2.
Nó dễ dàng theo đó
E (V( X) ) = 1n ( n - 1 )Σj > tôi( J - i ) σ2= n + 16σ2.
xy
E (C( X, Y)2) = 3 n6- 2 n5- 3 n2+ 2 n480 n2( n - 1 )2σ4.
XYn
ρ2( n ) = E ( C( X, Y)2)E (V( X) )2= 3403 n3- 2 n2+ 3 n - 2n3- n.
9 / 400,47ρ ( n )
ρ2( n )1000ρ2( n )n| ρ(n) |
Đây là R
mã để sản xuất con số.
f <- function(n){
m <- (2 - 3* n + 2* n^2 -3 * n^3)/(n - n^3) * 3/40
}
n.sim <- 1e4
par(mfrow=c(1,4))
for (n in c(3, 10, 30, 100)) {
u <- matrix(rnorm(n*n.sim), nrow=n)
v <- matrix(rnorm(n*n.sim), nrow=n)
x <- apply(u, 2, cumsum)
y <- apply(v, 2, cumsum)
sim <- rep(NA_real_, n.sim)
for (i in 1:n.sim)
sim[i] <- cor(x[,i], y[,i])^2
z <- signif(sqrt(n.sim)*(mean(sim) - f(n)) / sd(sim), 3)
hist(sim,xlab="rho(n)^2", main=paste("n =", n), sub=paste("Z =", z))
abline(v=mean(sim), lwd=2, col="Red")
abline(v=f(n), col="Blue", lwd=2, lty=3)
}