Thử nghiệm Dickey-Fuller nào cho chuỗi thời gian được mô hình hóa với khả năng chặn / trôi và xu hướng tuyến tính?


16

Phiên bản ngắn:

Tôi có một chuỗi thời gian của dữ liệu khí hậu mà tôi đang thử nghiệm cho sự ổn định. Dựa trên nghiên cứu trước đây, tôi hy vọng mô hình bên dưới (hoặc "tạo ra", có thể nói) dữ liệu có thuật ngữ chặn và xu hướng thời gian tuyến tính tích cực. Để kiểm tra các dữ liệu này cho sự ổn định, tôi có nên sử dụng thử nghiệm Dickey-Fuller bao gồm xu hướng chặn và thời gian, tức là phương trình # 3 không?

yt= =α0+α1t+δyt-1+bạnt

Hoặc, tôi có nên sử dụng thử nghiệm DF chỉ bao gồm một đánh chặn bởi vì sự khác biệt đầu tiên của phương trình mà tôi tin là làm cơ sở cho mô hình chỉ có một đánh chặn?

Phiên bản dài:

Như đã nêu ở trên, tôi có một chuỗi thời gian của dữ liệu khí hậu mà tôi đang thử nghiệm cho sự ổn định. Dựa trên nghiên cứu trước đây, tôi hy vọng mô hình bên dưới dữ liệu sẽ có thuật ngữ chặn, xu hướng thời gian tuyến tính tích cực và một số thuật ngữ lỗi được phân phối thông thường. Nói cách khác, tôi hy vọng mô hình cơ bản trông giống như thế này:

yt= =một0+một1t+βyt-1+bạnt

trong đó bạnt thường được phân phối. Vì tôi giả sử mô hình cơ bản có cả xu hướng chặn và xu hướng thời gian tuyến tính, tôi đã thử nghiệm cho một đơn vị gốc với phương trình # 3 của thử nghiệm Dickey-Fuller đơn giản, như được hiển thị:

yt= =α0+α1t+δyt-1+bạnt

Thử nghiệm này trả về một giá trị quan trọng sẽ khiến tôi từ chối giả thuyết khống và kết luận rằng mô hình cơ bản là không cố định. Tuy nhiên, tôi hỏi nếu tôi áp dụng này một cách chính xác, vì mặc dù các mô hình cơ bản được giả định có một đánh chặn và một xu hướng thời gian, điều này không có nghĩa là sự khác biệt đầu tiên sẽ là tốt. Thực tế hoàn toàn ngược lại, nếu toán học của tôi đúng.yt

Mô hình tính toán sự khác biệt đầu tiên dựa trên phương trình của giả định cơ bản cung cấp cho: yt= =yt-yt-1= =[một0+một1t+βyt-1+bạnt]-[một0+một1(t-1)+βyt-2+bạnt-1]

yt=[a0a0]+[a1tat(t1)]+β[yt1yt2]+[utut1]

yt=a1+βyt-1+bạnt-bạnt-1

Vì vậy, sự khác biệt đầu tiên dường như chỉ có một đánh chặn, không phải là một xu hướng thời gian.yt

Tôi nghĩ rằng câu hỏi của tôi tương tự như câu hỏi này , ngoại trừ tôi không chắc làm thế nào để áp dụng câu trả lời đó cho câu hỏi của mình.

Dữ liệu mẫu:

Đây là một số dữ liệu nhiệt độ mẫu mà tôi đang làm việc.

64.19749  
65.19011  
64.03281  
64.99111  
65.43837  
65.51817  
65.22061  
65.43191  
65.0221  
65.44038  
64.41756  
64.65764  
64.7486  
65.11544  
64.12437  
64.49148  
64.89215  
64.72688  
64.97553  
64.6361  
64.29038  
65.31076  
64.2114  
65.37864  
65.49637  
65.3289  
65.38394  
65.39384  
65.0984  
65.32695  
65.28  
64.31041  
65.20193  
65.78063  
65.17604  
66.16412  
65.85091  
65.46718  
65.75551  
65.39994  
66.36175  
65.37125  
65.77763  
65.48623  
64.62135  
65.77237  
65.84289  
65.80289  
66.78865  
65.56931  
65.29913  
64.85516  
65.56866  
64.75768  
65.95956  
65.64745  
64.77283  
65.64165  
66.64309  
65.84163  
66.2946  
66.10482  
65.72736  
65.56701  
65.11096  
66.0006  
66.71783  
65.35595  
66.44798  
65.74924  
65.4501  
65.97633  
65.32825  
65.7741  
65.76783  
65.88689  
65.88939  
65.16927  
64.95984  
66.02226  
66.79225  
66.75573  
65.74074  
66.14969  
66.15687  
65.81199  
66.13094  
66.13194  
65.82172  
66.14661  
65.32756  
66.3979  
65.84383  
65.55329  
65.68398  
66.42857  
65.82402  
66.01003  
66.25157  
65.82142  
66.08791  
65.78863  
66.2764  
66.00948  
66.26236  
65.40246  
65.40166  
65.37064  
65.73147  
65.32708  
65.84894  
65.82043  
64.91447  
65.81062  
66.42228  
66.0316  
65.35361  
66.46407  
66.41045  
65.81548  
65.06059  
66.25414  
65.69747  
65.15275  
65.50985  
66.66216  
66.88095  
65.81281  
66.15546  
66.40939  
65.94115  
65.98144  
66.13243  
66.89761  
66.95423  
65.63435  
66.05837  
66.71114 

1
Tôi không biết những gì có trong liên kết này ( tamino.wordpress.com/2010/03/11/not-a-random-walk ) trả lời câu hỏi của bạn, nhưng tôi nghĩ dù sao bạn cũng có thể quan tâm đến nó.
Matt Albrecht

@MattAlbrecht Đó là một liên kết rất thú vị. Tôi vẫn còn bối rối về cách tôi nên áp dụng thử nghiệm Dickey-Fuller cho chuỗi thời gian ban đầu của mình. Tôi đã cố gắng để thêm thông tin có liên quan trong chỉnh sửa gần đây của tôi.
Ricardo Altamirano

Xin lỗi tôi không thể cho bạn câu trả lời tốt hơn - Tôi không phải là người đứng đầu trong phân tích chuỗi thời gian của tôi. Tuy nhiên, bạn cũng có thể quan tâm đến câu hỏi này tôi đã hỏi gần đây ( stats.stackexchange.com/questions/27748 ) cũng thuộc chuỗi thời gian khí hậu và có một phân tích chi tiết thú vị về nhiệt độ so với CO2 từ một chuỗi thời gian chuyên nghiệp. Nó có thể giúp đỡ người khác nếu bạn cũng có một số dữ liệu mà bạn có thể đăng?
Matt Albrecht

@MattAlbrecht Tôi đã thêm một số dữ liệu mẫu. Có một định dạng tốt hơn cho tôi để đưa nó vào?
Ricardo Altamirano

Câu trả lời:


19

Bạn cần xem xét xu hướng trôi và (tham số / tuyến tính) theo các mức của chuỗi thời gian để xác định các thuật ngữ xác định trong hồi quy Dickey-Fuller tăng theo các khác biệt đầu tiên của chuỗi thời gian. Sự nhầm lẫn phát sinh chính xác từ việc đưa ra phương trình khác biệt đầu tiên theo cách mà bạn đã làm.

(Augmented) Mô hình hồi quy Dickey-Fuller

Giả sử rằng nồng độ của loạt bài gồm một trôi dạt và term trend Các giả thuyết của Phi tính chất tĩnh trong trường hợp này sẽ là H 0

Yt= =β0,tôi+β1,tôit+β2,tôiYt-1+εt
.H0:β2,tôi= =1

Một phương trình cho sự khác biệt đầu tiên ngụ ý bởi quá trình dữ liệu tạo này [DGP], là một trong những bạn đã có nguồn gốc Tuy nhiên, đây là không phải là hồi quy Dickey Fuller (tăng cường) như được sử dụng trong thử nghiệm.

ΔYt= =β1,tôi+β2,tôiΔYt-1+Δεt

Thay vào đó, phiên bản chính xác có thể có bằng cách trừ từ cả hai vế của phương trình đầu tiên dẫn đến Δ Y tYt-1 Đâylà hồi quy Dickey-Fuller (tăng cường) và phiên bản tương đương của giả thuyết null về tính không cố định là phép thửH0

ΔYt= =β0,tôi+β1,tôit+(β2,tôi-1)Yt-1+εtβ0,d+β1,dt+β2,dYt-1+εt
chỉ là phép thử t sử dụng ước lượng OLS là β 2 , d trong hồi quy ở trên. Lưu ý rằng sự trôi dạt và xu hướng đến thông số kỹ thuật này không thay đổi.H0:β2,d= =0β2,d

Một điểm bổ sung cần lưu ý là nếu bạn không chắc chắn về sự hiện diện của xu hướng tuyến tính trong các mức của chuỗi thời gian, thì bạn có thể cùng kiểm tra xu hướng tuyến tính và gốc đơn vị, đó là , có thể được kiểm tra bằng một chiếc F-test với các giá trị quan trọng thích hợp. Các thử nghiệm và giá trị tới hạn này được tạo bởi hàm Rtronggói.H0:[β2,d,β1,tôi]'= =[0,0]'ur.dfurca

Hãy để chúng tôi xem xét một số ví dụ chi tiết.

Ví dụ

1. Sử dụng chuỗi đầu tư của Hoa Kỳ

Ví dụ đầu tiên sử dụng chuỗi đầu tư của Hoa Kỳ được thảo luận trong Lutkepohl và Kratzig (2005, trang 9) . Cốt truyện của bộ truyện và sự khác biệt đầu tiên của nó được đưa ra dưới đây.

nhập mô tả hình ảnh ở đây

Từ các cấp độ của chuỗi, có vẻ như nó có ý nghĩa khác không, nhưng dường như không có xu hướng tuyến tính. Vì vậy, chúng tôi tiến hành hồi quy Dickey Fuller tăng cường với một phần chặn và cũng có ba độ trễ của biến phụ thuộc để tính tương quan nối tiếp, đó là:

ΔYt= =β0,d+β2,dYt-1+Σj= =13γjΔYt-j+εt
Lưu ý điểm chính mà tôi đã xem xét các mức để xác định phương trình hồi quy khác nhau.

Mã R để làm điều này được đưa ra dưới đây:

    library(urca)
    library(foreign)
    library(zoo)

    tsInv <- as.zoo(ts(as.data.frame(read.table(
      "http://www.jmulti.de/download/datasets/US_investment.dat", skip=8, header=TRUE)), 
                       frequency=4, start=1947+2/4))
    png("USinvPlot.png", width=6,
        height=7, units="in", res=100)
    par(mfrow=c(2, 1))
    plot(tsInv$USinvestment)
    plot(diff(tsInv$USinvestment))
    dev.off()

    # ADF with intercept
    adfIntercept <- ur.df(tsInv$USinvestment, lags = 3, type= 'drift')
    summary(adfIntercept)

H:[β2,d,β0,tôi]'= =[0,0]'

2. Sử dụng chuỗi tiêu thụ tiếng Đức (log)

Ví dụ thứ hai là sử dụng chuỗi thời gian tiêu thụ (log) hàng quý được điều chỉnh theo mùa của Đức. Cốt truyện của bộ truyện và sự khác biệt của nó được đưa ra dưới đây.

nhập mô tả hình ảnh ở đây

ΔYt= =β0,d+β1,dt+β2,dYt-1+Σj= =14γjΔYt-j+εt

Mã R để làm điều này là

# using the (log) consumption series
tsConsump <- zoo(read.dta("http://www.stata-press.com/data/r12/lutkepohl2.dta"), frequency=1)
png("logConsPlot.png", width=6,
    height=7, units="in", res=100)
par(mfrow=c(2, 1))
plot(tsConsump$ln_consump)
plot(diff(tsConsump$ln_consump))
dev.off()

# ADF with trend
adfTrend <- ur.df(tsConsump$ln_consump, lags = 4, type = 'trend')
summary(adfTrend)

H:[β2,d,β1,tôi]'= =[0,0]'

3. Sử dụng dữ liệu nhiệt độ đã cho

Bây giờ chúng tôi có thể đánh giá các thuộc tính của dữ liệu của bạn. Các lô thông thường ở cấp độ và sự khác biệt đầu tiên được đưa ra dưới đây.

nhập mô tả hình ảnh ở đây

Điều này cho thấy rằng dữ liệu của bạn có phần chặn và xu hướng, vì vậy chúng tôi thực hiện kiểm tra ADF (không có điều khoản chênh lệch đầu tiên bị trễ), sử dụng mã R sau

# using the given data
tsTemp <- read.table(textConnection("temp 
64.19749  
65.19011  
64.03281  
64.99111  
65.43837  
65.51817  
65.22061  
65.43191  
65.0221  
65.44038  
64.41756  
64.65764  
64.7486  
65.11544  
64.12437  
64.49148  
64.89215  
64.72688  
64.97553  
64.6361  
64.29038  
65.31076  
64.2114  
65.37864  
65.49637  
65.3289  
65.38394  
65.39384  
65.0984  
65.32695  
65.28  
64.31041  
65.20193  
65.78063  
65.17604  
66.16412  
65.85091  
65.46718  
65.75551  
65.39994  
66.36175  
65.37125  
65.77763  
65.48623  
64.62135  
65.77237  
65.84289  
65.80289  
66.78865  
65.56931  
65.29913  
64.85516  
65.56866  
64.75768  
65.95956  
65.64745  
64.77283  
65.64165  
66.64309  
65.84163  
66.2946  
66.10482  
65.72736  
65.56701  
65.11096  
66.0006  
66.71783  
65.35595  
66.44798  
65.74924  
65.4501  
65.97633  
65.32825  
65.7741  
65.76783  
65.88689  
65.88939  
65.16927  
64.95984  
66.02226  
66.79225  
66.75573  
65.74074  
66.14969  
66.15687  
65.81199  
66.13094  
66.13194  
65.82172  
66.14661  
65.32756  
66.3979  
65.84383  
65.55329  
65.68398  
66.42857  
65.82402  
66.01003  
66.25157  
65.82142  
66.08791  
65.78863  
66.2764  
66.00948  
66.26236  
65.40246  
65.40166  
65.37064  
65.73147  
65.32708  
65.84894  
65.82043  
64.91447  
65.81062  
66.42228  
66.0316  
65.35361  
66.46407  
66.41045  
65.81548  
65.06059  
66.25414  
65.69747  
65.15275  
65.50985  
66.66216  
66.88095  
65.81281  
66.15546  
66.40939  
65.94115  
65.98144  
66.13243  
66.89761  
66.95423  
65.63435  
66.05837  
66.71114"), header=T)
tsTemp <- as.zoo(ts(tsTemp, frequency=1))

png("tempPlot.png", width=6,
    height=7, units="in", res=100)
par(mfrow=c(2, 1))
plot(tsTemp$temp)
plot(diff(tsTemp$temp))
dev.off()

# ADF with trend
adfTrend <- ur.df(tsTemp$temp, type = 'trend')
summary(adfTrend)

Các kết quả cho cả thử nghiệm t và thử nghiệm F chỉ ra rằng null của sự không ổn định có thể bị loại bỏ đối với chuỗi nhiệt độ. Tôi hy vọng rằng làm rõ vấn đề phần nào.


5
Đây là một trong những câu trả lời rõ ràng và hữu ích nhất mà tôi đã nhận được trên mạng Stack Exchange và nó thực sự làm giảm sự nhầm lẫn của tôi về các bài kiểm tra DF. Cảm ơn bạn.
Ricardo Altamirano

@RicardoAltamirano Bạn được chào đón. Rất vui vì tôi có thể giúp.
tchakravarty

2
Đồng ý đây là một câu trả lời rất tốt.
RAH

0

Giả thuyết khống trong thử nghiệm Dickey-Fuller là có một đơn vị gốc trong một quy trình. Vì vậy, khi bạn từ chối null, bạn sẽ nhận được rằng quy trình của bạn là ổn định (với các thông báo thử nghiệm giả thuyết thông thường).

yt= =α0+α1t+δyt-1+bạnt

ytytyt-1mặt khác Khi bạn thể hiệnyt-1 về mặt yt-1 bạn chính xác đi đến kết luận rằng không có xu hướng trong quy trình khác biệt, nếu quy trình ban đầu là ổn định.


0

Câu trả lời trước đây là tuyệt vời.

Bạn thường đưa ra quyết định sẽ thực hiện thử nghiệm nào dựa trên cốt truyện. Trong trường hợp này, dữ liệu dường như có một xu hướng và chặn.

Nếu bạn kiểm tra Root-Root theo cấp độ, bạn sẽ sử dụng mô hình đánh chặn và xu hướng. Nếu bạn chạy thử nghiệm một cách khác biệt, bạn sẽ chỉ sử dụng một mô hình chặn.

Tôi chỉ trả lời câu hỏi này vì tôi phải khuyên bạn nên sử dụng các bài kiểm tra theo mùa trên dữ liệu này. Các xét nghiệm này thực sự phức tạp (làm việc với tính thời vụ không dễ dàng). Tuy nhiên, bản chất của dữ liệu (nhiệt độ) và bởi vì trong cốt truyện, bạn có thể quan sát một số hành vi theo mùa. Sau đó, bạn nên nghiên cứu về thử nghiệm HEGY và thực hiện nó nếu bạn muốn ước tính của mình mạnh mẽ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.