Cách diễn giải các lô ACF và PACF


10

Tôi chỉ muốn kiểm tra xem tôi đang giải thích chính xác các lô ACF và PACF:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Dữ liệu tương ứng với các lỗi được tạo giữa các điểm dữ liệu thực tế và các ước tính được tạo bằng mô hình AR (1).

Tôi đã xem câu trả lời ở đây:

Ước tính các hệ số ARMA thông qua kiểm tra ACF và PACF

Sau khi đọc có vẻ như các lỗi không được tự động sửa lỗi nhưng tôi chỉ muốn chắc chắn, mối quan tâm của tôi là:

1.) Lỗi đầu tiên là đúng trên ranh giới (khi đó là trường hợp tôi nên chấp nhận hoặc từ chối rằng có tương quan tự động đáng kể ở độ trễ 1)?

2.) Các đường biểu thị khoảng tin cậy 95% và cho rằng có 116 độ trễ tôi mong đợi không quá (0,05 * 116 = 5,8 mà tôi làm tròn đến 6) 6 độ trễ vượt quá ranh giới. Đối với ACF thì đây là trường hợp nhưng đối với PACF có khoảng 10 trường hợp ngoại lệ. Nếu bạn bao gồm những người ở biên giới, nó giống như 14? Điều này vẫn chỉ ra không có tương quan tự động?

3.) Tôi có nên đọc bất cứ điều gì về thực tế là tất cả các vi phạm của khoảng tin cậy 95% xảy ra với nhược điểm không?

Câu trả lời:


9

Không có cấu trúc rõ ràng trong các ô mà bạn hiển thị.

Thứ tự độ trễ của các tự tương quan một phần âm nằm ngoài các dải không phải là bội số của nhau (chúng là độ trễ, 22, 56, 62, 78, 94), nghĩa là chúng không phát sinh sau một số độ trễ thông thường như ví dụ 12 , 24, 36, 48, vì vậy tôi sẽ không suy ra bất kỳ mô hình nào dựa trên mô hình đó từ cốt truyện.

Để bổ sung, bạn có thể áp dụng thử nghiệm chạy , đây là thử nghiệm về tính độc lập có thể hữu ích để nắm bắt các giá trị dương hoặc âm, điều này sẽ gợi ý một số mẫu trong dữ liệu.

Liên quan đến tầm quan trọng của một số sự tương quan tôi thấy rằng chúng phát sinh tại các đơn đặt hàng lớn. Bạn nên suy nghĩ nếu những điều đó tự động có ý nghĩa hoặc có thể được dự kiến ​​trong bối cảnh dữ liệu của bạn. Có hợp lý không khi mong đợi rằng giá trị quan sát 56 quan sát trước đây sẽ ảnh hưởng đến quan sát hiện tại? Nếu chúng tôi có dữ liệu hàng quý, sẽ đáng để kiểm tra mối tương quan đáng kể ở độ trễ 8 và 12 vì chúng là bội số của tính tuần hoàn của dữ liệu và có thể phản ánh một số mẫu theo mùa mà chúng tôi có thể giải thích trong ngữ cảnh của dữ liệu. Nhưng tôi sẽ không lo lắng nhiều nếu độ trễ đáng kể phát sinh ở độ trễ 9, 11 hoặc độ trễ cao hơn nhiều mà tôi không có một lời giải thích nào sẽ coi đó là một mô hình thông thường.


2

Kiểm tra tương quan của phần dư (chênh lệch giữa điểm dữ liệu thực tế và ước tính) được thực hiện để kiểm tra xem có bất kỳ mẫu quan trọng nào về dữ liệu không bị bỏ sót trong mô hình ARIMA không. Nếu tất cả thông tin đã được nắm bắt, thì các ô ACF và PACF sẽ giống với nhiễu trắng.

ACF và PACF cho tiếng ồn trắng

Nếu kiểm tra trực quan không giúp tự tin giả định như vậy, thì bạn có thể thử chạy thử nghiệm Box-Ljung trên phần dư.

Giả thuyết khống, trong kịch bản này, đối với thử nghiệm Box-Ljung sẽ là phần dư không khác với nhiễu trắng.

Sau đây là mã để chạy thử nghiệm trong r:

Box.test(residuals, lag = 28, fitdf = 5, type = "Ljung")

Giá trị độ trễ được đặt dựa trên số hệ số tự tương quan độ trễ và fitdf là số mức độ tự do được trừ. Đối với ARIMA (p, d, q) (P, D, Q) m, tôi thường đặt fitdf = (p + q + P + Q)

Nếu thử nghiệm Box-Ljung trả về giá trị p lớn, điều đó cho thấy phần dư không còn tự động tương quan, nghĩa là chúng giống với nhiễu trắng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.