Khi tôi ước tính bước đi ngẫu nhiên với AR (1), hệ số này rất gần với 1 nhưng luôn nhỏ hơn.
Lý do toán học mà hệ số không lớn hơn một là gì?
Khi tôi ước tính bước đi ngẫu nhiên với AR (1), hệ số này rất gần với 1 nhưng luôn nhỏ hơn.
Lý do toán học mà hệ số không lớn hơn một là gì?
Câu trả lời:
Chúng tôi ước tính bằng OLS mô hình
Đối với một mẫu có kích thước T, công cụ ước tính là
Nếu cơ chế tạo ra dữ liệu thật sự là một bước đi ngẫu nhiên thuần túy, sau đó , và
Sự phân bố lấy mẫu của OLS ước lượng, hoặc tương đương, sự phân bố lấy mẫu , không phải là đối xứng xung quanh không, nhưng đúng hơn đó là lệch sang trái của số không, với≈68% giá trị thu được (tức là≈xác khối lượng) là tiêu cực, và vì vậy chúng tôi có được thường xuyên hơn không ρ <1. Đây là một phân phối tần số tương đối
Điều này đôi khi được gọi là phân phối "Dickey-Fuller", bởi vì nó là cơ sở cho các giá trị quan trọng được sử dụng để thực hiện các bài kiểm tra Đơn vị gốc cùng tên.
Tôi không hồi tưởng khi thấy một nỗ lực cung cấp trực giác cho hình dạng của phân phối mẫu. Chúng tôi đang xem xét phân phối mẫu của biến ngẫu nhiên
Nếu chúng ta tính tổng các tiêu chuẩn sản phẩm độc lập, chúng ta sẽ có một phân phối duy trì đối xứng quanh 0. Ví dụ:
Nhưng nếu chúng tôi tổng hợp các tiêu chuẩn sản phẩm không độc lập như trường hợp của chúng tôi, chúng tôi sẽ nhận được
bị lệch sang phải nhưng với khối lượng xác suất cao hơn được phân bổ cho các giá trị âm. Và khối lượng dường như bị đẩy nhiều hơn về bên trái nếu chúng ta tăng kích thước mẫu và thêm các yếu tố tương quan vào tổng.
Đối ứng của tổng số Gammas không độc lập là một biến ngẫu nhiên không âm với độ lệch dương.
Đây không thực sự là một câu trả lời nhưng quá dài cho một bình luận, vì vậy tôi vẫn đăng bài này.
Tôi đã có thể nhận được một hệ số lớn hơn 1 hai lần trong số một trăm cho cỡ mẫu là 100 (sử dụng "R"):
N=100 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~y[-T]) # regress y on its own first lag, with intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
Thực hiện 84 và 95 có hệ số trên 1, vì vậy không phải lúc nào cũng dưới một. Tuy nhiên, xu hướng rõ ràng là có một ước tính sai lệch đi xuống. Các câu hỏi vẫn còn, tại sao ?
Chỉnh sửa: các hồi quy trên bao gồm một thuật ngữ chặn mà dường như không thuộc về mô hình. Sau khi loại bỏ chặn, tôi nhận được nhiều ước tính hơn 1 (3158 trên 10000) - nhưng rõ ràng là dưới 50% của tất cả các trường hợp:
N=10000 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1