Một loạt văn phòng phẩm xu hướng có thể được mô hình hóa với ARIMA?


12

Tôi có một câu hỏi / nhầm lẫn về loạt văn phòng phẩm cần thiết để lập mô hình với ARIMA (X). Tôi đang nghĩ về điều này nhiều hơn về mặt suy luận (ảnh hưởng của một can thiệp), nhưng muốn biết liệu dự báo so với suy luận có tạo ra bất kỳ sự khác biệt nào trong phản ứng hay không.

Câu hỏi:

Tất cả các tài nguyên giới thiệu mà tôi đã đọc đều nói rằng bộ truyện cần phải đứng yên, điều này có ý nghĩa với tôi và đó là nơi "cái tôi" trong arima xuất hiện (khác biệt).

Điều làm tôi bối rối là việc sử dụng các xu hướng và trôi dạt trong ARIMA (X) và ý nghĩa (nếu có) cho các yêu cầu cố định.

Việc sử dụng một biến không đổi / trôi dạt và / hoặc biến xu hướng như một biến ngoại sinh (tức là thêm 't' làm biến hồi quy) có phủ nhận yêu cầu của chuỗi là đứng yên không? Là câu trả lời khác nhau tùy thuộc vào việc loạt có gốc đơn vị (ví dụ: kiểm tra adf) hoặc có xu hướng xác định nhưng không có gốc đơn vị?

HOẶC LÀ

Có phải một loạt luôn phải đứng yên, được thực hiện thông qua sự khác biệt và / hoặc giảm dần trước khi sử dụng ARIMA (X)?

Câu trả lời:


12

Nhìn vào các ý kiến ​​có vẻ như chúng tôi đã không giải quyết câu hỏi về cách lựa chọn giữa một xu hướng xác định hoặc ngẫu nhiên. Đó là, làm thế nào để tiến hành trong thực tế chứ không phải là hậu quả hoặc tính chất của từng trường hợp.

Một cách để tiến hành như sau: Bắt đầu bằng cách áp dụng thử nghiệm ADF.

  • Nếu null của một đơn vị gốc bị từ chối, chúng tôi đã hoàn thành. Xu hướng (nếu có) có thể được biểu thị bằng một xu hướng tuyến tính xác định.
  • Nếu null của thử nghiệm ADF không bị từ chối thì chúng tôi áp dụng thử nghiệm KPSS (trong đó giả thuyết null là ngược lại, ổn định hoặc ổn định xung quanh xu hướng tuyến tính).

    o Nếu null của kiểm tra KPSS bị từ chối thì chúng tôi kết luận rằng có một đơn vị gốc và hoạt động với những khác biệt đầu tiên của dữ liệu. Dựa trên những khác biệt đầu tiên của loạt bài, chúng ta có thể kiểm tra tầm quan trọng của các biến hồi quy khác hoặc chọn mô hình ARMA.

    o Nếu null của thử nghiệm KPSS không bị từ chối thì chúng ta sẽ phải nói rằng dữ liệu không có nhiều thông tin vì chúng ta không thể từ chối bất kỳ giả thuyết null nào. Trong trường hợp này có thể an toàn hơn khi làm việc với những khác biệt đầu tiên của loạt bài.

Như đã đề cập trong câu trả lời trước, hãy nhớ rằng các thử nghiệm này có thể bị ảnh hưởng bởi sự hiện diện của các ngoại lệ (ví dụ: ngoại lệ tại một thời điểm duy nhất do lỗi khi ghi dữ liệu hoặc thay đổi cấp do ví dụ thay đổi chính sách ảnh hưởng đến loạt từ một thời điểm nhất định trên). Vì vậy, cũng nên kiểm tra các vấn đề này và lặp lại phân tích trước đó sau khi bao gồm các biến hồi quy cho một số ngoại lệ tiềm năng.


Tuyệt vời! Câu hỏi nhận xét của tôi ở trên có đúng không nếu chúng tôi thấy những gì trông giống xu hướng, chúng tôi sử dụng thử nghiệm ADF bao gồm xu hướng (tùy chọn số 3 trong liên kết tôi đã đăng)?
B_Miner

Câu hỏi cuối cùng - bạn làm gì trong tình huống bạn lắp ARIMA, nói ARIMA (0,1,1) cho một chuỗi và giá trị trung bình của sự khác biệt là khác không? Điều này có nghĩa là tôi tin rằng bạn thêm một hằng số vào mô hình - cũng thể hiện xu hướng tuyến tính trong chuỗi ban đầu. Trường hợp này có ý nghĩa gì? Là xu hướng trong chuỗi ban đầu có tính xác định bởi vì sự khác biệt của chuỗi không loại bỏ xu hướng?
B_Miner

@B_Miner Về nhận xét đầu tiên của bạn, tôi sẽ bắt đầu bằng cách chỉ bao gồm một phần chặn. Nếu xu hướng có vẻ hơi theo cấp số nhân, bạn cũng có thể thêm tham số độ dốc của xu hướng tuyến tính và xem nó có quan trọng không. Nói chung, tốt hơn là bắt đầu với một mô hình có ít tham số và nếu chẩn đoán phần dư không thỏa đáng thì hãy xem xét thêm các yếu tố khác.
javlacalle

@B_Miner Lấy sự khác biệt đầu tiên loại bỏ cả xu hướng xác định và xu hướng ngẫu nhiên. Nếu bạn thấy một xu hướng trong chuỗi khác biệt trong một mô hình có đánh chặn, thì bạn nên xem xét lấy lại sự khác biệt (nghĩa là kiểm tra gốc đơn vị thứ hai).
javlacalle

1
@pidosaurus thiếu thỏa thuận giữa các xét nghiệm ADF và KPSS có thể là do kích thước mẫu nhỏ, sự hiện diện của các ngoại lệ, xu hướng phi tuyến tính, ... nếu sau khi kiểm tra thêm vẫn không rõ cái nào phù hợp hơn, có thể an toàn hơn để xem xét sự hiện diện của một đơn vị gốc. Một cái nhìn nhanh chóng để dữ liệu của bạn đề nghị với tôi sự hiện diện của một xu hướng phi tuyến tính, một xu hướng bậc hai có dạng có thể thích hợp. a1t+a2t2
javlacalle

5

Hãy nhớ rằng có nhiều loại không cố định khác nhau và các cách khác nhau về cách đối phó với chúng. Bốn cái phổ biến là:

1) Xu hướng xác định hoặc xu hướng ổn định. Nếu loạt của bạn thuộc loại xu hướng này, nó sẽ bao gồm xu hướng thời gian trong mô hình hồi quy / mô hình. Bạn có thể muốn kiểm tra định lý FrischTHER Waugh bù Lovell trên cái này.

2) Thay đổi mức độ và phá vỡ cấu trúc. Nếu đây là trường hợp bạn nên bao gồm một biến giả cho mỗi lần nghỉ hoặc nếu mẫu của bạn đủ dài mô hình mỗi regimé riêng biệt.

3) Thay đổi phương sai. Mô hình hóa các mẫu riêng biệt hoặc mô hình hóa phương sai thay đổi bằng cách sử dụng lớp mô hình ARCH hoặc GARCH.

4) Nếu loạt của bạn chứa một đơn vị gốc. Nói chung, sau đó bạn nên kiểm tra mối quan hệ hợp nhất giữa các biến nhưng vì bạn quan tâm đến việc dự báo đơn biến, bạn nên chênh lệch nó một hoặc hai lần tùy theo thứ tự tích hợp.

Để mô hình chuỗi thời gian bằng lớp mô hình ARIMA, các bước sau đây phải phù hợp:

1) Nhìn vào ACF và PACF cùng với một chuỗi thời gian để xem có hay không chuỗi đó là văn phòng phẩm hoặc không cố định.

2) Kiểm tra chuỗi cho một đơn vị gốc. Điều này có thể được thực hiện với một loạt các thử nghiệm, một số thử nghiệm phổ biến nhất là thử nghiệm ADF, thử nghiệm Phillips-Perron (PP), thử nghiệm KPSS không có giá trị ổn định hoặc thử nghiệm DF-GLS hiệu quả nhất của các bài kiểm tra nói trên. GHI CHÚ! Rằng trong trường hợp loạt bài của bạn chứa một sự phá vỡ cấu trúc, các bài kiểm tra này thiên về việc không từ chối null của một đơn vị gốc. Trong trường hợp bạn muốn kiểm tra độ bền của các xét nghiệm này và nếu bạn nghi ngờ một hoặc nhiều phá vỡ cấu trúc, bạn nên sử dụng các xét nghiệm phá vỡ cấu trúc nội sinh. Hai cách phổ biến là thử nghiệm Z Pivot-Andrews cho phép phá vỡ cấu trúc nội sinh và Clemente-Montañés-Reyes cho phép phá vỡ hai cấu trúc. Cái sau cho phép hai mô hình khác nhau.

3) Nếu có một đơn vị gốc trong chuỗi thì bạn nên phân biệt chuỗi. Sau đó, bạn nên chạy xem ACF, PACF và biểu đồ chuỗi thời gian và có thể kiểm tra gốc đơn vị thứ hai để ở bên an toàn. ACF và PACF sẽ giúp bạn quyết định số lượng thuật ngữ AR và MA bạn nên đưa vào.

4) Nếu chuỗi không chứa gốc đơn vị nhưng biểu đồ chuỗi thời gian và ACF cho thấy chuỗi đó có xu hướng xác định, bạn nên thêm xu hướng khi khớp mô hình. Một số người cho rằng nó hoàn toàn hợp lệ khi chỉ khác biệt chuỗi khi nó chứa một xu hướng xác định mặc dù thông tin có thể bị mất trong quá trình. Không bao giờ là một ý tưởng tốt để phân biệt nó để thấy có nhiều thuật ngữ AR và / hoặc MA bạn sẽ cần phải bao gồm. Nhưng một xu hướng thời gian là hợp lệ.

5) Lắp các mô hình khác nhau và thực hiện kiểm tra chẩn đoán thông thường, bạn có thể muốn sử dụng tiêu chí thông tin hoặc MSE để chọn mô hình tốt nhất được cung cấp cho mẫu phù hợp với mẫu đó.

6) Thực hiện dự báo mẫu trên các mô hình được trang bị tốt nhất và tính toán các hàm mất mát như MSE, MAPE, MAD để xem chúng thực sự hoạt động tốt nhất khi sử dụng chúng để dự báo vì đó là điều chúng tôi muốn làm!

7) Thực hiện dự báo mẫu của bạn như một ông chủ và hài lòng với kết quả của bạn!


Và để trả lời câu hỏi của bạn một cách nhanh chóng. Có nó có thể.
Plissken

Tôi không được phép bình luận ở trên vì tôi không có đủ danh tiếng nhưng tôi muốn chỉ ra rằng một quá trình tiếng ồn trắng là đứng yên. Giá trị trung bình và phương sai của nó không thay đổi theo thời gian nên nó đứng yên!
Plissken

Dan, câu trả lời tuyệt vời! Về nhận xét cuối cùng của bạn ở đây, bạn có nói rằng nếu bạn kết thúc với tiếng ồn trắng còn lại, đó là văn phòng phẩm .... thì nó sẽ cho bạn biết rằng bạn đã mô hình hóa chuỗi đầy đủ (nghĩa là xử lý các vấn đề về văn phòng phẩm đúng cách / đầy đủ)?
B_Miner

1
Đúng chính xác. Thông thường, phép thử Ljung-Box Q được sử dụng để kiểm tra các phần dư để xem liệu chúng có ngẫu nhiên hay không. Trong trường hợp họ là mô hình là một đại diện đầy đủ của dữ liệu. Một điều mà tôi quên đề cập đến trong câu trả lời ở trên cũng là sau khi bạn đã trang bị mô hình, bạn có thể xem sơ đồ chuỗi thời gian ACF và chuỗi thời gian còn lại của loạt được trang bị. Điều này sẽ cung cấp cho bạn một dấu hiệu tốt cho dù phần dư của bạn có bị nhiễu trắng hay không (ACF không nên có bất kỳ độ trễ đáng kể nào). Dù sao, hầu hết các gói thống kê đều có lệnh cho bài kiểm tra Ljung-Box Q.
Plissken

Dưới đây là liên kết wiki cho bài kiểm tra Ljung-Box Q: en.wikipedia.org/wiki/Ljung%E2%80%93Box_test
Plissken

5

Xác định xem xu hướng (hoặc thành phần khác như tính thời vụ) là xác định hay ngẫu nhiên là một phần của câu đố trong phân tích chuỗi thời gian. Tôi sẽ thêm một vài điểm cho những gì đã được nói.

1) Sự khác biệt giữa xu hướng xác định và ngẫu nhiên quan trọng bởi vì nếu một gốc đơn vị có trong dữ liệu (ví dụ: đi bộ ngẫu nhiên) thì thống kê kiểm tra được sử dụng cho suy luận không tuân theo phân phối truyền thống. Xem bài đăng này để biết một số chi tiết và tài liệu tham khảo.

Chúng ta có thể mô phỏng bước đi ngẫu nhiên (xu hướng ngẫu nhiên trong đó cần có sự khác biệt đầu tiên), kiểm tra tầm quan trọng của xu hướng xác định và xem tỷ lệ phần trăm các trường hợp trong đó null của xu hướng xác định bị từ chối. Trong R, chúng ta có thể làm:

require(lmtest)
iter <- 10000
cval <- 0.05
n <- 120
rejections <- 0
set.seed(123)
for (i in seq.int(iter))
{
  x <- cumsum(rnorm(n)) # random walk
  fit <- lm(x ~ seq(n))
  if (coeftest(fit)[2,"Pr(>|t|)"] < cval)
    rejections <- rejections + 1
}
100 * rejections / iter
#[1] 88.67

Ở mức ý nghĩa 5%, chúng tôi hy vọng sẽ loại bỏ null trong 95% trường hợp, tuy nhiên, trong thí nghiệm này, nó chỉ bị từ chối trong ~ 89% trường hợp trong số 10.000 lần đi bộ ngẫu nhiên mô phỏng.

Chúng ta có thể áp dụng các kiểm tra gốc đơn vị để kiểm tra xem một đơn vị gốc có mặt hay không. Nhưng chúng ta phải nhận thức được rằng một xu hướng tuyến tính có thể dẫn đến việc không thể từ chối null của một đơn vị gốc. Để đối phó với điều này, thử nghiệm KPSS xem xét vô hiệu của sự ổn định xung quanh một xu hướng tuyến tính.

2) Một vấn đề khác là việc giải thích các thành phần xác định trong một quy trình theo cấp độ hoặc sự khác biệt đầu tiên. Hiệu ứng của một đánh chặn không giống nhau trong một mô hình với xu hướng tuyến tính như trong một bước đi ngẫu nhiên. Xem bài này để minh họa.

yt=μ+yt1+ϵt,ϵtNID(0,σ2).

ytiyt

yt=μ+yt1μ+yt2+ϵt1+ϵt=2μ+yt2μ+yt3+ϵt2+ϵt1+ϵt=3μ+yt3+ϵt2+ϵt1+ϵt...

Chúng tôi đến:

yt=y0+μt+i=1tϵi

y0μμμ được gọi là trôi dạt).

Nếu biểu diễn đồ họa của một chuỗi cho thấy một xu hướng tuyến tính tương đối rõ ràng, chúng ta không thể chắc chắn liệu đó có phải là do sự hiện diện của một xu hướng tuyến tính xác định hoặc do sự trôi dạt trong một quá trình đi bộ ngẫu nhiên. Đồ họa bổ sung và thống kê kiểm tra nên được áp dụng.

Có một số lưu ý cần lưu ý vì một phân tích dựa trên đơn vị gốc và các thống kê kiểm tra khác không thể đánh lừa được. Một số thử nghiệm này có thể bị ảnh hưởng bởi sự hiện diện của các quan sát xa hoặc dịch chuyển cấp độ và yêu cầu lựa chọn thứ tự độ trễ không phải lúc nào cũng đơn giản.

Như một giải pháp cho câu đố này, tôi nghĩ rằng cách thực hành phổ biến là lấy sự khác biệt của dữ liệu cho đến khi chuỗi trông ổn định (ví dụ: nhìn vào hàm tự tương quan, sẽ chuyển sang không nhanh) và sau đó chọn mô hình ARMA.


Greta post- bạn rõ ràng là một tài sản tuyệt vời cho trang web này! Tôi tò mò tìm kiếm ở đây và các bài đăng khác của bạn - có thể sử dụng thử nghiệm ADF hoặc KPSS để xác định xem những gì trông giống như một xu hướng trong chuỗi ở cấp độ là xác định hoặc ngẫu nhiên? Tôi đã tìm thấy cái này: facemony.smu.edu/tfomby/eco6375/BJ%20Notes/ADF%20Notes.pdf trông giống như nếu bạn thấy một xu hướng trực quan trong chuỗi, hãy sử dụng tùy chọn # 3 của bài kiểm tra và nếu bạn không từ chối null, bạn có bằng chứng cho một xu hướng xác định.
B_Miner

Dựa trên nhận xét của Dan, tôi đoán nếu bạn nhận được tiếng ồn trắng, không có vấn đề nào trong số này :)
B_Miner

5

Câu hỏi rất thú vị, tôi cũng muốn biết người khác nói gì. Tôi là một kỹ sư được đào tạo và không phải là một nhà thống kê, vì vậy ai đó có thể kiểm tra logic của tôi. Là kỹ sư, chúng tôi muốn mô phỏng và thử nghiệm, vì vậy tôi đã có động lực để mô phỏng và kiểm tra câu hỏi của bạn.

Như được thể hiện bằng thực nghiệm dưới đây, việc sử dụng biến xu hướng trong ARIMAX đã phủ nhận sự cần thiết phải phân biệt và làm cho chuỗi xu hướng đứng yên. Đây là logic tôi đã sử dụng để xác minh.

  1. Mô phỏng một quy trình AR
  2. Đã thêm một xu hướng xác định
  3. Sử dụng ARIMAX được mô hình hóa theo xu hướng là biến ngoại sinh của chuỗi trên mà không có sự khác biệt.
  4. Đã kiểm tra phần dư cho tiếng ồn trắng và nó hoàn toàn ngẫu nhiên

Dưới đây là mã R và các ô:

set.seed(3215)

##Simulate an AR process
x <- arima.sim(n = 63,list(ar = c(0.7)));
plot(x)

## Add Deterministic Trend to AR
t <- seq(1, 63)
beta <- 0.8
t_beta <- ts(t*beta,frequency=1)
ar_det <- x+t_beta
plot(ar_det)

## Check with arima

ar_model <- arima(ar_det,order=c(1,0,0),xreg=t,include.mean=FALSE)

## Check whether residuals of fitted model is random

pacf(ar_model$residuals)

AR (1) Lô mô phỏng nhập mô tả hình ảnh ở đây

AR (1) với xu hướng xác định nhập mô tả hình ảnh ở đây

ARIMAX dư PACF với xu hướng là ngoại sinh. Các công thức là ngẫu nhiên, không còn mẫu nhập mô tả hình ảnh ở đây

Như có thể thấy ở trên, mô hình hóa xu hướng xác định như một biến ngoại sinh trong mô hình ARIMAX phủ nhận sự cần thiết phải phân biệt. Atleast trong trường hợp xác định nó làm việc. Tôi tự hỏi làm thế nào điều này sẽ hành xử với xu hướng ngẫu nhiên rất khó dự đoán hoặc mô hình.

Để trả lời câu hỏi thứ hai của bạn, CÓ tất cả ARIMA bao gồm ARIMAX phải được đặt cố định. Ít nhất đó là những gì sách giáo khoa nói.

Ngoài ra, như đã bình luận, xem bài viết này . Giải thích rất rõ ràng về Xu hướng Xác định so với Xu hướng Stochastic và cách loại bỏ chúng để làm cho nó trở thành xu hướng ổn định và khảo sát văn học rất hay về chủ đề này. Họ sử dụng nó trong bối cảnh mạng thần kinh, nhưng nó rất hữu ích cho vấn đề chuỗi thời gian chung. Khuyến nghị cuối cùng của họ là khi nó được xác định rõ ràng là xu hướng xác định, làm giảm tuyến tính, khác áp dụng khác biệt để làm cho chuỗi thời gian đứng yên. Bồi thẩm đoàn vẫn còn ở ngoài đó, nhưng hầu hết các nhà nghiên cứu được trích dẫn trong bài viết này đề nghị sự khác biệt trái ngược với suy giảm tuyến tính.

Biên tập:

Dưới đây là bước đi ngẫu nhiên với quá trình ngẫu nhiên trôi dạt, sử dụng biến ngoại sinh và arima khác biệt. Cả hai dường như đưa ra cùng một câu trả lời và về bản chất chúng giống nhau.

library(Hmisc)

set.seed(3215)

## ADD Stochastic Trend to simulated Arima this is AR(1) with unit root with non zero mean

y = rep(NA,63)
y[[1]] <- 2


for (i in 2:63)  {
y[i] <-3+1*y[i-1]+ rnorm(1, mean = 0, sd = 1)
} 

plot(y,type="l")

y_ts <- ts(y,frequency=1)

## Lag to create Xreg

y_1 <- Lag(y,shift=1)


## Start from 2 value to avoid NA and make it equal length with xreg

y <- window(y_ts,start =2,end=63)
xreg1 <- y_1[-1]

## Check the values with ARIMA and xreg

g <- arima(y,order=c(0,0,0),xreg=xreg1)

pacf(g$residuals)

## Check the values with ARIM

g1 <- arima(y,order=c(0,1,0))

pacf(g1$residuals)

## 

ARIMA(0,0,0) with non-zero mean 

Coefficients:
      intercept   xreg1
         3.1304  0.9976
s.e.     0.2664  0.0025

Hi vọng điêu nay co ich!


Tôi cũng quan tâm đến quan điểm của người khác - Tôi không chắc chắn, liệu tiếng ồn trắng còn lại có đáp ứng yêu cầu cho loạt phim đứng yên không - tức là nếu bạn đạt được tiếng ồn trắng, bạn có thể hài lòng không? Hoặc, có bao gồm biến ngoại sinh thực sự hoạt động để "khử xu hướng" và làm cho loạt bài này đứng yên không? Tôi tự hỏi nếu kiểm tra câu hỏi sau này là nếu bạn có cùng một mô hình (hệ số ar1, v.v.) nếu bạn không theo xu hướng với hồi quy tuyến tính và sau đó phù hợp với arima (1,0,0) ... Tôi đã làm điều này và kết quả gần Vì vậy, có thể thêm biến ngoại sinh cũng giống như giảm dần.
B_Miner

Vâng, nó là như vậy, vài tháng trước tôi đã tình cờ thấy điều này trong một bài báo dự báo mạng thần kinh. Tôi sẽ cung cấp tài liệu tham khảo nếu tôi tìm thấy nó.
dự báo

Bất kỳ ý tưởng về trường hợp khi có một đơn vị gốc hoặc khi có một hằng số trong mô hình?
B_Miner

Tôi đã cập nhật câu trả lời của tôi với bài viết mà tôi đang tham khảo.
dự báo

Tôi nghĩ rằng bạn có thể đã không lưu nó.
B_Miner
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.