Phân tích các lô ACF và PACF


21

Tôi muốn xem liệu tôi có đang đi đúng hướng phân tích các lô ACF và PACF của mình không:

nhập mô tả hình ảnh ở đây

Bối cảnh: (Reff: Philip Hans Franses, 1998)

  1. Vì cả ACF và PACF đều thể hiện các giá trị quan trọng, tôi cho rằng mô hình ARMA sẽ phục vụ nhu cầu của tôi

  2. ACF có thể được sử dụng để ước tính phần MA, tức là giá trị q, PACF có thể được sử dụng để ước tính phần AR, tức là giá trị p

  3. Để ước tính thứ tự mô hình, tôi xem xét a.) Liệu các giá trị ACF có đủ chết hay không, b.) Liệu ACF có báo hiệu quá mức và c.) Liệu ACF và PACF có hiển thị bất kỳ đỉnh đáng kể và dễ hiểu nào ở độ trễ nhất định không

  4. ACF và PACF có thể đề xuất không chỉ một mô hình mà nhiều mô hình mà tôi cần chọn sau khi xem xét các công cụ chẩn đoán khác

Có ý nghĩ đó, tôi sẽ tiếp tục và nói rằng mô hình rõ ràng nhất dường như là ARMA (4.2) khi các giá trị ACF chết ở độ trễ 4 và PACF hiển thị tăng đột biến ở 1 và 2.

Một cách khác để phân tích sẽ là ARMA (2.1) khi tôi thấy hai đột biến đáng kể trong PACF của tôi và một đột biến đáng kể trong ACF của tôi (sau đó các giá trị bị chết bắt đầu từ điểm thấp hơn nhiều (0,4)).

Nhìn vào kết quả dự báo trong mẫu của tôi (sử dụng Lỗi phần trăm tuyệt đối trung bình đơn giản) ARMA (2.1) mang lại kết quả tốt hơn nhiều so với ARMA (4.2). Vì vậy, tôi sử dụng ARMA (2.1)!

Bạn có thể xác nhận phương pháp và kết quả phân tích các lô ACF và PACF của tôi không?

Giúp đánh giá cao!

CHỈNH SỬA:

Thống kê mô tả:

count  252.000000
mean    29.576151
std      7.817171
min     -0.920000
25%     26.877500
50%     30.910000
75%     34.915000
max     47.430000

Skewness of endog_var: [-1.35798399]

Kurtsosis of endog_var: [ 5.4917757]

Augmented Dickey-Fuller Test for endog_var: (-3.76140904255411, 0.0033277703768345287, {'5%': -2.8696473721448728, '1%': -3.4487489051519011, '10%': -2.5710891239349585}

Chuỗi thời gian:

nhập mô tả hình ảnh ở đây

Dư lượng (ARMA (2.1):

nhập mô tả hình ảnh ở đây

ACF / PACF của cư dân:

nhập mô tả hình ảnh ở đây

EDIT II:

Dữ liệu:

14.37561
23.95561
25.41561
13.88561
23.31561
33.12561
35.30561
35.78561
37.21561
35.23561
37.34561
38.28561
39.03561
36.34561
39.08561
39.34561
38.80561
40.10561
34.13561
35.42561
27.29561
34.13561
39.89561
47.77561
40.57561
36.15561
33.66561
30.97561
24.90561
23.41561
0.31561
8.45561
37.36561
33.40561
13.97561
11.62561
35.07561
36.15561
37.09561
36.95561
37.85561
32.31561
35.41561
36.35561
37.34561
35.90561
37.40561
36.44561
37.37561
36.16561
35.24561
38.47561
39.18561
39.61561
29.55561
35.50561
38.05561
40.32561
44.39561
37.65561
46.27561
29.41561
40.41561
33.44561
37.04561
35.34561
25.24561
30.23561
15.40561
26.79561
35.38561
40.22561
43.14561
36.96561
41.93561
11.30561
6.87561
32.92561
34.54561
38.27561
36.40561
25.44561
37.26561
26.39561
31.13561
35.90561
38.41561
33.66561
33.16561
31.96561
30.34561
37.77561
32.25561
33.21561
38.37561
36.63561
40.78561
35.60561
36.37561
34.42561
42.67561
33.40561
31.49561
24.81561
23.82561
37.34561
30.73561
21.04561
18.20561
27.36561
18.49561
25.41561
27.92561
29.42561
25.91561
27.56561
28.69561
29.89561
31.47561
29.34561
25.35561
21.98561
28.61561
33.87561
20.07561
27.36561
26.48561
20.37561
22.33561
28.52561
21.24561
10.77561
18.69561
30.19561
33.89561
29.81561
27.55561
22.37561
20.32561
22.43561
31.89561
32.10561
27.67561
36.93561
36.51561
26.96561
21.27561
34.68561
34.13561
35.80561
25.38561
33.42561
9.28561
8.70561
30.36561
30.29561
29.56561
28.41561
33.40561
18.47561
16.48561
18.51561
26.35561
25.40561
19.92561
21.26561
10.90561
32.71561
26.71561
29.99561
28.87561
28.55561
14.07561
10.97561
24.92561
26.40561
21.40561
29.08561
30.18561
30.27561
16.15561
21.96561
32.29561
29.57561
30.24561
30.82561
28.83561
27.30561
26.53561
28.39561
29.76561
29.50561
31.81561
34.79561
24.14561
31.34561
33.14561
35.04561
33.20561
33.53561
35.28561
29.84561
35.02561
33.63561
35.65561
35.73561
35.35561
37.18561
27.38561
34.40561
33.69561
29.05561
34.55561
31.76561
30.91561
34.70561
35.87561
28.31561
30.39561
28.03561
30.72561
30.57561
23.93561
25.11561
32.15561
26.74561
28.76561
32.49561
34.79561
27.90561
33.05561
29.50561
31.67561
34.36561
36.88561
32.31561
26.24561
26.66561
33.59561
37.64561
38.26561
36.20561
33.27561
29.94561
29.19561
27.41561
37.24561
36.26561
30.84561
35.46561
32.24561
31.44561
33.40561
30.71561
33.03561
36.43561
33.44561
22.32561
18.65561
31.97561
27.00561
29.66561
30.76561
33.44561
29.19561
12.32561
33.41561
37.13561
33.43561
37.35561
40.17561
29.38561
19.70561
35.44561
30.48561
30.72561
16.09561
30.82561
30.55561
34.38561
35.45561
34.87561
33.78561
33.87561
29.83561
26.35561
26.44561
28.72561
30.85561
28.18561
12.18561
31.82561
18.01561
27.57561
29.38561
20.32561
22.36561
34.01561
34.40561
20.23561
-0.57439
9.87561
29.55561
31.01561
30.00561
28.12561
13.47561
7.42561
22.01561
20.38561
27.57561
31.54561
29.90561
16.40561
21.27561
26.22561
31.47561
31.11561
32.97561
32.34561
29.36561
32.40561
31.16561
32.05561
31.78561
32.34561
33.87561
31.80561
29.90561
30.09561
32.36561
28.15561
26.30561
15.32561
31.03561
33.47561
33.44561
33.71561
28.30561
12.70561
10.17561
43.96561
9.58561
35.38561
33.82561
41.37561
33.40561
33.64561
20.30561
27.85561
29.01561
32.36561
28.33561
29.90561
27.19561
0.39561
8.40561
0.24561
11.87561
29.15561
20.40561
0.42561
29.29561
23.39561
19.36561

Dữ liệu nhìn hơi lệch trái, có lẽ không cố định. Đối với tôi có vẻ như có một số vấn đề tiềm ẩn với phần dư, thậm chí có thể là sự không đồng nhất có điều kiện.
Glen_b -Reinstate Monica

Theo tôi, độ lệch cho thấy các giá trị dị thường (xung) chỉ có thể được xác nhận bằng cách phân tích dữ liệu gốc.
IrishStat

Câu trả lời:


8

Nhìn vào ACF và PACF của bạn cũng hữu ích trong bối cảnh phân tích đầy đủ của bạn. Thống kê Ljung-Box Q của bạn; giá trị p; khoảng tin cậy, ACF và PACF nên được xem cùng nhau. Ví dụ, bài kiểm tra Q ở đây:

acf, ci, Q, pvalue = tsa.acf(res1.resid, nlags=4,confint=95,  qstat=True, unbiased=True)

Ở đây - bài kiểm tra Q của chúng tôi cho tự động tương quan là một kiểm tra ruột tổng thể về giải thích đồ họa của chúng tôi.

Dự thảo ghi chú về phân tích chuỗi thời gian trong Statsmodels: http://conference.scipy.org/proceedings/scipy2011/pdfs/statsmodels.pdf


14

Sự phụ thuộc duy nhất vào ACF và PACF bằng cách sử dụng các công cụ được đề xuất vào giữa những năm 60 đôi khi nhưng hiếm khi chính xác ngoại trừ dữ liệu mô phỏng. Các công cụ nhận dạng mô hình như AIC / BIC hầu như không bao giờ xác định chính xác một mô hình hữu ích mà chỉ hiển thị những gì xảy ra khi bạn không đọc bản in nhỏ liên quan đến các giả định. Tôi sẽ đề nghị bạn bắt đầu một cách đơn giản nhất có thể NHƯNG không quá đơn giản và ước tính một mô hình dự kiến; AR (1) theo đề xuất của Glen_b. Phần dư / phân tích từ mô hình dự kiến ​​này có thể được sử dụng để tính toán một ACF và PACF khác gợi ý tăng mô hình tiềm năng hoặc đơn giản hóa mô hình. Lưu ý rằng giải thích ala tài liệu tham khảo của bạn YÊU CẦU rằng chuỗi / phần dư hiện tại không có bất kỳ cấu trúc xác định nào, ví dụ: Xung, Chuyển dịch cấp độ, Xu hướng thời gian cục bộ và xung theo mùa và hơn nữa là chuỗi có phương sai sai số không đổi và các tham số của mô hình dự kiến ​​là bất biến theo thời gian. Nếu bạn muốn bạn có thể đăng dữ liệu của mình và tôi sẽ cố gắng giúp bạn hình thành một mô hình hữu ích.

EDIT SAU DỮ LIỆU ĐƯỢC BÁO CÁO:

365 giá trị đã được phân phối và phân tích, thu được mô hình AR (1) sau với các xung được xác định và 2 mức dịch chuyển. nhập mô tả hình ảnh ở đây. lưu ý rằng đây đã là một dự đoán phổ biến. Phần dư từ mô hình này được vẽ ở đây nhập mô tả hình ảnh ở đây. Có một gợi ý về sự không đồng nhất của phương sai nhưng đây là một triệu chứng và người ta cần tìm ra phương pháp chữa trị chính xác mà cuối cùng chúng ta sẽ tìm thấy. Tiến hành acf của phần dư được hiển thị ở đây cho thấy nhập mô tả hình ảnh ở đâymột gợi ý về sự không phù hợp của mô hình. Một cái nhìn sâu hơn về bảng acf của phần dư có ở đâynhập mô tả hình ảnh ở đâyđề xuất cấu trúc ở độ trễ 7 và 14. Đặt hai đầu mối lại với nhau (cỡ mẫu 365 và cấu trúc độ trễ hàng tuần đáng kể) Tôi quyết định điều tra xem đây có thực sự là dữ liệu hàng ngày hay không. Người dùng mới thường bỏ qua thông tin rất quan trọng khi họ xác định dữ liệu của họ với tiền đề sai lầm rằng máy tính phải đủ thông minh để tìm ra mọi thứ. Lưu ý rằng các đầu mối lag 7 và lag 14 đã bị ngập trong các ô ACF và PACF của OP. Sự hiện diện của cấu trúc xác định trong phần dư làm tăng phương sai lỗi do đó triệt tiêu acf. Khi đã xác định được các ngoại lệ / xung / mức dịch chuyển, acf cho thấy sự hiện diện của cấu trúc tự động / chỉ báo hàng ngày mà sau đó cần phải được tính đến.

Sau đó tôi đã phân tích dữ liệu cho phép phần mềm tiến hành với manh mối rằng đó là dữ liệu hàng ngày. Chỉ với 365 giá trị, không thể xây dựng chính xác các mô hình có chứa các yếu tố dự đoán theo mùa / kỳ nghỉ NHƯNG có thể có hơn 1 năm dữ liệu.

Mô hình đã được tìm thấy được trình bày ở đây nhập mô tả hình ảnh ở đâycó 5 hình nộm hàng ngày, hai Ca khúc Cấp độ, một số xung và mô hình arima có dạng (1,0,0) (1,0,0). Biểu đồ của phần dư không còn chứng minh cấu trúc không cố định như một mô hình tốt hơn được đưa ra. nhập mô tả hình ảnh ở đây. Th nhập mô tả hình ảnh ở đâye acf của phần dư là sạch hơn nhiều. Biểu đồ Actual / Cleansed làm nổi bật các điểm xung bất thường. nhập mô tả hình ảnh ở đây. Bài học ở đây là khi một người phân tích dữ liệu mà không có thông tin quan trọng rằng đó là chuỗi thời gian hàng ngày, có rất nhiều xung phản ánh sự thể hiện không đầy đủ (hoặc có lẽ là kiến ​​thức nâng cao về đầu mối hàng ngày). Thực tế / Phù hợp và Dự báo được trình bày ở đây nhập mô tả hình ảnh ở đây.

Sẽ rất thú vị khi xem những người khác sẽ làm gì với cùng một bộ dữ liệu. Lưu ý rằng tất cả các phân tích được thực hiện ở chế độ rảnh tay bằng phần mềm có sẵn trên thị trường.


1
Sáng sớm đọc nhầm ... Đừng thường thấy độ trễ (0) trong biểu đồ của tôi
IrishStat

1
Nó cũng lừa tôi lúc đầu.
Glen_b -Reinstate Monica

Cảm ơn câu trả lời của bạn. Là một người không có kinh nghiệm trong lĩnh vực dự báo chuỗi thời gian, thật khó để hiểu đầy đủ quy trình chọn mô hình phù hợp vì không có cách nào chính thức để đi. Thật không may, tôi không được phép đăng dữ liệu thô của tôi. Tôi hy vọng rằng thông tin bổ sung này hữu ích (xem 'EDIT:')
Peter Knutsen

Bạn có thể chia tỷ lệ / mặt nạ dữ liệu của bạn trước khi bạn trình bày nó. Nhìn vào cốt truyện, có vẻ như có một số giá trị bất thường mà nếu không được điều trị đi xuống sẽ làm sai lệch acf và pacf không chính xác cho thấy sự đầy đủ. Có một gợi ý trực quan về một xu hướng giảm theo sau là không có xu hướng nhưng đó chỉ là dự đoán tại thời điểm này.
IrishStat

tôi vừa thêm một số dữ liệu mà bạn có thể sử dụng ..
Peter Knutsen

11

Có vẻ như tôi đang đếm các mũi nhọn ở độ trễ 0.

PACF của bạn hiển thị một đột biến lớn một cách hợp lý ở độ trễ 1, cho thấy AR (1). Điều này tất nhiên sẽ gây ra sự sụt giảm giống như hình học trong ACF (mà nói rộng ra, bạn thấy). Bạn dường như đang cố gắng để phù hợp với sự phụ thuộc hai lần - cả hai như AR và MA.

Tôi vừa mới thử AR (1) để bắt đầu và xem liệu còn gì đáng để lo lắng nữa không.


Peter; câu trả lời của tôi có một lỗi đánh máy trong đó (tôi đã sửa AR (1) trong đoạn cuối cùng, nhưng đã gõ MA (1) trong đoạn thứ hai), hiện đã được sửa.
Glen_b -Reinstate Monica

Cảm ơn câu trả lời của bạn. Đếm từ độ trễ 0 tất nhiên là một sai lầm chính yếu! Tôi đã thử AR (1) và kết quả không tốt bằng ARMA (2.1)!
Peter Knutsen

Nó cũng có thể là trường hợp nó không tốt như vậy - tuy nhiên, AR (1) sẽ là nơi để bắt đầu. Ví dụ, PACF của phần dư trông như thế nào? Bộ truyện gốc trông như thế nào? Có nhiều điều có thể xảy ra mà không thể lượm lặt được một cách dễ dàng từ ACF và PACF của dữ liệu.
Glen_b -Reinstate Monica

Cảm ơn. Tôi đã đăng một số thông tin bổ sung có thể dẫn đến những hiểu biết mới.
Peter Knutsen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.