Ước tính bước đi ngẫu nhiên với AR (1)


10

Khi tôi ước tính bước đi ngẫu nhiên với AR (1), hệ số này rất gần với 1 nhưng luôn nhỏ hơn.

Lý do toán học mà hệ số không lớn hơn một là gì?


Tôi đã thử với hộp công cụ Matlab và cũng với tập lệnh của tôi trên arima (trong đó hệ số được giới hạn ở [-10,10] và kết quả là như nhau). Tôi thử với một OLS đơn giản và kết quả là như nhau.
Marco

Ước tính là thiên về hướng xuống, chúng ta phải đọc giấy Dickey và Fuller.
Marco

Câu trả lời:


12

Chúng tôi ước tính bằng OLS mô hình

xt=ρxt1+ut,E(ut{xt1,xt2,...})=0,x0=0

Đối với một mẫu có kích thước T, công cụ ước tính là

ρ^=t=1Txtxt1t=1Txt12=ρ+t=1Tutxt1t=1Txt12

Nếu cơ chế tạo ra dữ liệu thật sự là một bước đi ngẫu nhiên thuần túy, sau đó , vàρ=1

xt= =xt-1+bạntxt= =ΣTôi= =1tbạnTôi

Sự phân bố lấy mẫu của OLS ước lượng, hoặc tương đương, sự phân bố lấy mẫu , không phải là đối xứng xung quanh không, nhưng đúng hơn đó là lệch sang trái của số không, với68% giá trị thu được (tức làxác khối lượng) là tiêu cực, và vì vậy chúng tôi có được thường xuyên hơn không ρ <1. Đây là một phân phối tần số tương đốiρ^-168ρ^<1

nhập mô tả hình ảnh ở đây

Nghĩa là:-0,0017773Trung bình:-0,00085984Tối thiểu: -0,0287575Tối đa: 0,0052173Độ lệch chuẩn: 0,0031625Skewness: -2,2568Ví dụ. kurtosis: 8.3017

Điều này đôi khi được gọi là phân phối "Dickey-Fuller", bởi vì nó là cơ sở cho các giá trị quan trọng được sử dụng để thực hiện các bài kiểm tra Đơn vị gốc cùng tên.

Tôi không hồi tưởng khi thấy một nỗ lực cung cấp trực giác cho hình dạng của phân phối mẫu. Chúng tôi đang xem xét phân phối mẫu của biến ngẫu nhiên

ρ^-1= =(Σt= =1Tbạntxt-1)(1Σt= =1Txt-12)

Nếu bạntρ^-1ρ^-1

T= =5

Nếu chúng ta tính tổng các tiêu chuẩn sản phẩm độc lập, chúng ta sẽ có một phân phối duy trì đối xứng quanh 0. Ví dụ:

nhập mô tả hình ảnh ở đây

Nhưng nếu chúng tôi tổng hợp các tiêu chuẩn sản phẩm không độc lập như trường hợp của chúng tôi, chúng tôi sẽ nhận được

nhập mô tả hình ảnh ở đây

bị lệch sang phải nhưng với khối lượng xác suất cao hơn được phân bổ cho các giá trị âm. Và khối lượng dường như bị đẩy nhiều hơn về bên trái nếu chúng ta tăng kích thước mẫu và thêm các yếu tố tương quan vào tổng.

Đối ứng của tổng số Gammas không độc lập là một biến ngẫu nhiên không âm với độ lệch dương.

ρ^-1


Wow, phân tích tốt đẹp! Bạn có thể chỉ ra giả định OLS tiêu chuẩn nào bị vi phạm ở đây không?
Richard Hardy

@RichardHardy Cảm ơn. Tôi sẽ trở lại sau để trả lời bình luận của bạn.
Alecos Papadopoulos

Tôi vẫn tò mò về các giả định OLS ... Cảm ơn trước!
Richard Hardy

Tôi hơi bối rối ở đây. Trong trường hợp của một bước đi ngẫu nhiên mà chúng tôi cố gắng để ước lượng phương trình , do cointegrating realtionsip X t + 1 - X tXt+1= =αXt+εXt+1-Xt chúng ta nên hội tụ ở mức superconsistent. Là mô phỏng của bạn cũng chỉ ra sự không nhất quán?
Cagdas Ozgenc

ρ^<1ρ^-1

6

Đây không thực sự là một câu trả lời nhưng quá dài cho một bình luận, vì vậy tôi vẫn đăng bài này.

Tôi đã có thể nhận được một hệ số lớn hơn 1 hai lần trong số một trăm cho cỡ mẫu là 100 (sử dụng "R"):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Thực hiện 84 và 95 có hệ số trên 1, vì vậy không phải lúc nào cũng dưới một. Tuy nhiên, xu hướng rõ ràng là có một ước tính sai lệch đi xuống. Các câu hỏi vẫn còn, tại sao ?

Chỉnh sửa: các hồi quy trên bao gồm một thuật ngữ chặn mà dường như không thuộc về mô hình. Sau khi loại bỏ chặn, tôi nhận được nhiều ước tính hơn 1 (3158 trên 10000) - nhưng rõ ràng là dưới 50% của tất cả các trường hợp:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

chính xác, không phải "luôn luôn" nhỏ nhưng trong phần lớn trường hợp. Nó rõ ràng là một kết quả giả. Tại sao lại có lý do?
Marco

2
xtxt-1
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.