Cách phân tích xu hướng trong chuỗi thời gian không định kỳ


12

Giả sử tôi có theo chuỗi thời gian không định kỳ. Rõ ràng xu hướng đang giảm và tôi muốn chứng minh điều đó bằng một số thử nghiệm (với giá trị p ). Tôi không thể sử dụng hồi quy tuyến tính cổ điển do tương quan tự động (nối tiếp) mạnh mẽ giữa các giá trị.

library(forecast)
my.ts <- ts(c(10,11,11.5,10,10.1,9,11,10,8,9,9,
               6,5,5,4,3,3,2,1,2,4,4,2,1,1,0.5,1),
            start = 1, end = 27,frequency = 1)
plot(my.ts, col = "black", type = "p",
     pch = 20, cex = 1.2, ylim = c(0,13))
# line of moving averages 
lines(ma(my.ts,3),col="red", lty = 2, lwd = 2)

nhập mô tả hình ảnh ở đây

Những lựa chọn của tôi là gì?


4
Tôi nghĩ rằng thực tế là loạt bài không định kỳ ( frequency=1) ít liên quan ở đây. Một vấn đề có liên quan hơn có thể là liệu bạn có sẵn sàng chỉ định một biểu mẫu chức năng cho mô hình của bạn hay không.
Richard Hardy

1
Một số thông tin thêm về những gì dữ liệu có thể sẽ hữu ích cho mô hình.
bdeonovic

Dữ liệu là số lượng cá thể (tính bằng nghìn) của một số loài nhất định được đếm hàng năm trong hồ chứa nước.
Ladislav Naďo

1
@LadislavNado là loạt của bạn ngắn như trong ví dụ được cung cấp? Tôi hỏi bởi vì nếu vậy, nó làm giảm số lượng phương pháp có thể được sử dụng do kích thước mẫu.
Tim

1
Sự rõ ràng của khía cạnh giảm dần phụ thuộc khá nhiều vào quy mô, mà theo tôi, nên được tính đến
Laurent Duval

Câu trả lời:


7

Như bạn đã nói, xu hướng trong dữ liệu ví dụ của bạn là rõ ràng. Nếu bạn muốn chứng minh thực tế này bằng kiểm tra giả thuyết, ngoài việc sử dụng hồi quy tuyến tính (lựa chọn tham số rõ ràng), bạn có thể sử dụng thử nghiệm Mann-Kendall không tham số cho xu hướng đơn điệu. Bài kiểm tra được sử dụng để

đánh giá nếu có một xu hướng tăng hoặc giảm đơn điệu của biến quan tâm theo thời gian. Xu hướng đơn điệu tăng (giảm) có nghĩa là biến luôn tăng (giảm) theo thời gian, nhưng xu hướng có thể hoặc không thể tuyến tính. ( http://vsp.pnnl.gov/help/Vsample/Design_Trend_Mann_Kendall.htmlm )

hơn nữa, như Gilbert (1987) đã ghi nhận, bài kiểm tra

đặc biệt hữu ích vì các giá trị thiếu được cho phép và dữ liệu không cần phải tuân theo bất kỳ phân phối cụ thể nào

xjxin(n1)/2

S=i=1n1j=i+1nsgn(xjxi)

sgn()S τ1+1τ

τ=Sn(n1)/2

pn10pSS

var(S)=118[n(n1)(2n+5)p=1gtp(tp1)(2tp+5)]

ZMK

ZMK={S1var(S)if S>00if S=0S+1var(S)if S<0

ZMK

  • ZMKZ1α
  • ZMKZ1α
  • |ZMK|Z1α/2

Trong chủ đề này, bạn có thể tìm thấy mã R thực hiện kiểm tra này.

SpSpSdataSpermutationSdataSpermutation


Gilbert, RO (1987). Phương pháp thống kê để giám sát ô nhiễm môi trường. Wiley, NY.

Önöz, B., & Bayazit, M. (2003). Sức mạnh của kiểm tra thống kê để phát hiện xu hướng. Tạp chí Khoa học Kỹ thuật và Môi trường Thổ Nhĩ Kỳ, 27 (4), 247-251.


1

Vấn đề mà bạn có "Tôi không thể sử dụng hồi quy tuyến tính cổ điển do tương quan tự động (nối tiếp) mạnh mẽ giữa các giá trị." trong thực tế là một cơ hội. Tôi đã lấy 27 giá trị của bạn và sử dụng AUTOBOX một phần mềm (mà tôi đã giúp phát triển) có thể (tùy chọn) tự động xác định một mô hình có thể. Dưới đây là biểu đồ thực tế / phù hợp và dự báo nhập mô tả hình ảnh ở đây. ACF của phần dư ở đây với âm mưu còn lại ở đây nhập mô tả hình ảnh ở đây. Mô hình là ở đây nhập mô tả hình ảnh ở đâyvà ở đây nhập mô tả hình ảnh ở đâyvà ở đâynhập mô tả hình ảnh ở đây. Hai hệ số mô tả chính xác dữ liệu với "xu hướng" ước tính hay còn gọi là "độ lệch" tức là khoảng thời gian đến khoảng chênh lệch -.596. Lưu ý rằng đây là một loại xu hướng trong đó mô hình của bạn đã sử dụng các số đếm 1,2, ... 27 làm biến dự đoán. Nếu dữ liệu của bạn đề xuất loại xu hướng đó thì phần mềm sẽ thấy nó có thể áp dụng nhiều hơn. Tôi sẽ thử và tìm một bài viết trước đó của tôi trong đó chi tiết đầy đủ / tương phản hai loại xu hướng này. Tại đây Xác định mô hình xu hướng ngẫu nhiênPhát hiện xu hướng ban đầu hoặc ngoại lệ

nhập mô tả hình ảnh ở đây


2
Dự báo Autobox bỏ lỡ mọi điểm thú vị 1996, 1999, 2000, 2009 khi xu hướng gần đây bị phá vỡ. Nó gần giống như sự thay đổi pha trong một năm. Về vấn đề đó, nó không giải thích bất cứ điều gì.
Aksakal

Đề xuất trước đây của bạn (lưỡi trong má) về việc phù hợp với đa thức mức độ cao cho dữ liệu sẽ làm những gì bạn yêu cầu. Nhưng chúng tôi không phải là phù hợp với chúng tôi là về mô hình. Biểu đồ dư dường như mô tả đầy đủ một quy trình lỗi do một số yếu tố bên ngoài / không xác định. Tất cả các mô hình đều sai nhưng một số hữu ích. Điều này tôi tin là một mô hình hữu ích nhưng nếu bạn nghĩ rằng bạn có thể làm tốt hơn xin vui lòng gửi kết quả của bạn để tất cả chúng ta có thể học hỏi. Không có lời giải thích nào từ một mô hình ARIMA vì quá khứ chỉ là một proxy cho các biến bị bỏ qua.
IrishStat

2
Trong trường hợp này, dường như không có nhiều liên quan đến thống kê. Nó không phải là một câu hỏi thống kê thú vị ở tất cả. Có một xu hướng rõ ràng và OP phải nghiên cứu vật lý của hiện tượng này. Tôi nghĩ rằng những mô hình phù hợp như từ Autobox chỉ đơn giản là dẫn OP đi sai hướng. Họ không tiết lộ bất cứ điều gì có giá trị vượt quá những gì hiển nhiên.
Aksakal

Câu hỏi đặt ra là liệu phân tích có thể thay thế mắt người hay không ... Phân tích cho thấy những gì mắt hỗ trợ, Đây là lý do tại sao chúng ta thực hành thống kê để có thể làm được nhiều hơn có thể nhìn thấy ngay lập tức. Giải pháp AUTOBOX dẫn OP đi đúng hướng tức là đi xuống. Ý kiến ​​của bạn hoàn toàn không có ích trong quan điểm của tôi NHƯNG như tôi đã hỏi trước đây (một cách lịch sự) vui lòng cung cấp một thống kê thay thế khả thi. Theo tôi đây là một câu hỏi thống kê rất thú vị và cần có câu trả lời. Vui lòng cung cấp một nếu bạn có thể.
IrishStat 17/2/2016

1

Bạn có thể sử dụng hệ số tương quan xếp hạng của Spearman để xác định mức độ dữ liệu của bạn là đơn điệu. Nó trả về giá trị dương cho dữ liệu tăng đơn điệu và giá trị âm cho dữ liệu giảm đơn điệu (giữa -1 và +1). Theo liên kết ở trên, cũng có một phần xử lý kiểm tra ý nghĩa, mặc dù tôi chắc chắn rằng hầu hết các gói phần mềm sẽ có giá trị p được thực hiện cho bạn khi tính toán các hệ số tương quan (ví dụ: trong Matlab : [RHO,PVAL] = corr(...); trong R cor.test(x,...):)


0

Bạn có thể sử dụng OLS vì không có tự động tương tự nối tiếp (ít nhất là trong mẫu bạn đã cung cấp); lưu ý thống kê kiểm tra Durbin-Watson là 1.966 (≈2).

Vì vậy, ước tính hệ số âm đáng kể cho x1 là tất cả những gì bạn cần nói

Số lượng quan sát được của [một số loài] đang giảm khoảng 1.000 mỗi năm.

hoặc là

Số lượng quan sát được của [một số loài] đang giảm từ 630 đến 1.408 mỗi năm (với độ tin cậy 95%).

Điều này giả định rằng phương pháp đếm loài có độ che phủ tốt và phù hợp qua nhiều năm trong mẫu của bạn.

nhập mô tả hình ảnh ở đây

Điều này được tạo ra với mã Python này (xin lỗi; không có R tiện dụng):

import numpy as np
import statsmodels.api as sm

y = [10,12,10,11,8,9,6,4,2,4]
x = np.arange(len(y))
x = sm.add_constant(x)

mod = sm.OLS(y, x)
result = mod.fit()
print(result.summary())

0

Biết nguồn dữ liệu sẽ rất hữu ích và cả thông tin nếu các giá trị my.tscó thể bị âm hoặc không.

Tuy nhiên, xem xét nhanh về cốt truyện, thay vì nhìn thấy một xu hướng tuyến tính không đổi , tôi muốn đề xuất rằng chuỗi thời gian không đứng yên, do đó được tích hợp . Ví dụ, giá cổ phiếu cũng được tích hợp, nhưng lợi nhuận chứng khoán không còn nữa (chúng dao động gần 0).

Giả thuyết này cũng có thể được kiểm tra bằng cách sử dụng Augmented Dickey Fuller Test:

require(tseries)
adf.test(my.ts)

Augmented Dickey-Fuller Test
Dickey-Fuller = -2.9557, Lag order = 2, p-value = 0.7727
alternative hypothesis: stationary

Với giá trị p không thấp hơn 0,05, không có bằng chứng nào cho thấy quá trình này đứng yên.

Để có được dữ liệu cố định, bạn phải phân biệt nó:

diff.ts <- diff(my.ts)
plot(diff.ts)

nhập mô tả hình ảnh ở đây

Bây giờ dữ liệu cho thấy không còn xu hướng nữa, và điều duy nhất bạn sẽ tìm thấy là một điều khoản tự động của lệnh 2 (sử dụng acf(diff.ts)).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.