Hiểu độ trễ k trong bài kiểm tra Dickey Fuller tăng cường của R


15

Tôi đã chơi xung quanh với một số kiểm tra gốc đơn vị trong R và tôi không hoàn toàn chắc chắn nên làm gì với tham số k lag. Tôi đã sử dụng thử nghiệm Dickey Fuller tăng cường và thử nghiệm Philipps Perron từ gói tseries . Rõ ràng tham số mặc định (cho ) chỉ phụ thuộc vào độ dài của chuỗi. Nếu tôi chọn các giá trị k khác nhau, tôi nhận được kết quả khá khác nhau. từ chối null:kadf.testk

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

cộng với kết quả kiểm tra PP:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

Nhìn vào dữ liệu, tôi sẽ nghĩ rằng dữ liệu cơ bản là không cố định, nhưng tôi vẫn không coi những kết quả này là một bản sao lưu mạnh, đặc biệt vì tôi không hiểu vai trò của tham số . Nếu tôi nhìn vào decompose / stl tôi thấy rằng xu hướng này có tác động mạnh mẽ thay vì chỉ đóng góp nhỏ từ phần còn lại hoặc thay đổi theo mùa. Loạt của tôi là tần số hàng quý.k

Có gợi ý nào không?


3
cuốn sách này sẽ trả lời tất cả các câu hỏi của bạn.
mpiktas

1
cảm ơn! Tôi yêu loạt sử dụng Springer, nhưng tôi không biết cái này ...
hans0l0

hmm, iiuc các thử nghiệm này chỉ cho dù phi = 1, không phải nếu phi> 1. Nhưng đầu ra R vẫn cho biết phương án thay thế là: văn phòng phẩm. Vậy họ có kiểm tra phi> 1 không? Rõ ràng đó cũng sẽ không cố định.
hans0l0

Câu trả lời:


5

Đã được một thời gian kể từ khi tôi xem xét nghiệm ADF, tuy nhiên tôi nhớ ít nhất hai phiên bản thử nghiệm adf.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/lvern/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

Gói fUnitRoots có một hàm gọi là adfTest (). Tôi nghĩ rằng vấn đề "xu hướng" được xử lý khác nhau trong các gói đó.

Chỉnh sửa ------ Từ trang 14 của liên kết sau, có 4 phiên bản (ngừng hoạt động) của thử nghiệm adf:

http://math.uncc.edu/~zcai/FinTS.pdf

Thêm một liên kết. Đọc phần 6.3 trong liên kết sau. Nó thực hiện một công việc btter xa hơn tôi có thể làm trong việc giải thích thuật ngữ trễ:

http://www.yats.com/doc/cointegration-en.html

Ngoài ra, tôi sẽ cẩn thận với bất kỳ mô hình theo mùa. Trừ khi bạn chắc chắn có một số tính thời vụ, tôi sẽ tránh sử dụng thuật ngữ theo mùa. Tại sao? Bất cứ điều gì có thể được chia thành các điều khoản theo mùa, ngay cả khi nó không. Đây là hai ví dụ:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

Biểu đồ bên dưới là từ câu lệnh trên (x.stl) ở trên. stl () tìm thấy một thuật ngữ theo mùa nhỏ trong tiếng ồn trắng. Bạn có thể nói rằng thuật ngữ đó quá nhỏ đến nỗi nó thực sự không phải là một vấn đề. Vấn đề là, trong dữ liệu thực, bạn không biết liệu thuật ngữ đó có phải là vấn đề hay không. Trong ví dụ dưới đây, lưu ý rằng chuỗi dữ liệu xu hướng có các phân đoạn trông giống như một phiên bản được lọc của dữ liệu thô và các phân đoạn khác có thể được coi là khác biệt đáng kể so với dữ liệu thô.

nhập mô tả hình ảnh ở đây


1

Tham số k là một tập hợp độ trễ được thêm vào để giải quyết mối tương quan nối tiếp. A trong ADF có nghĩa là thử nghiệm được tăng cường bằng cách thêm độ trễ. Việc lựa chọn số lượng độ trễ trong ADF có thể được thực hiện bằng nhiều cách khác nhau. Một cách phổ biến là bắt đầu với một số lượng lớn độ trễ được chọn trước và giảm số lượng độ trễ liên tục cho đến khi độ trễ dài nhất có ý nghĩa thống kê.

Bạn có thể kiểm tra mối tương quan nối tiếp trong phần dư sau khi áp dụng độ trễ trong ADF.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.