Nhiều mô hình ARIMA phù hợp với dữ liệu tốt. Làm thế nào để xác định thứ tự? Cách tiếp cận đúng?


8

Tôi đã có hai chuỗi thời gian (tham số của một mô hình dành cho nam và nữ) và nhằm xác định một mô hình ARIMA phù hợp để đưa ra dự báo. Chuỗi thời gian của tôi trông như sau:

nhập mô tả hình ảnh ở đây

Cốt truyện và ACF cho thấy không cố định (các gai của ACF bị cắt rất chậm). Vì vậy, tôi sử dụng sự khác biệt và thu được:

nhập mô tả hình ảnh ở đây

Cốt truyện này chỉ ra rằng loạt phim hiện có thể đứng yên và việc áp dụng thử nghiệm kpss và thử nghiệm adf hỗ trợ cho giả thuyết này.

Bắt đầu với loạt Nam, chúng tôi thực hiện các quan sát sau:

  • Sự tự tương quan theo kinh nghiệm tại Lags 1,4,5,26 và 27 khác biệt đáng kể so với số không.
  • ACF cắt (?), Nhưng tôi lo ngại về các đột biến tương đối lớn ở độ trễ 26 và 27.
  • Chỉ có tự động tương quan một phần theo kinh nghiệm tại Lags 1 và 2 là khác biệt đáng kể so với không.

Dựa trên những quan sát này, nếu tôi phải chọn một mô hình AR hoặc MA thuần túy cho chuỗi thời gian khác biệt, tôi sẽ có xu hướng chọn một mô hình AR (2) bằng cách lập luận rằng:

  • Chúng tôi không có tự động tương quan một phần đáng kể cho độ trễ lớn hơn 2
  • ACF bị cắt ngoại trừ khu vực xung quanh độ trễ 27. (Có phải một vài ngoại lệ này chỉ là một chỉ báo, rằng một mô hình ARMA hỗn hợp sẽ phù hợp?)

hoặc một mô hình MA (1) bằng cách lập luận rằng:

  • PACF rõ ràng cắt đứt
  • Chúng tôi có độ trễ lớn hơn 1 chỉ 4 gai vượt quá giá trị tới hạn về độ lớn. Đây là "chỉ" một hơn 3 gai (95% trong số 60) sẽ được phép nằm bên ngoài khu vực chấm.

Không có đặc điểm của mô hình ARIMA (1,1,1) và việc chọn thứ tự p và q của mô hình ARIMA với lý do ACF và PACF cho p + q> 2 trở nên khó khăn.

Sử dụng auto.arima () với tiêu chí AIC (Tôi nên sử dụng AIC hay AICC?) Mang lại:

  1. ARIMA (2,1,1) với Độ lệch; AIC = 280,2783
  2. ARIMA (0,1,1) với Độ lệch; AIC = 280,2784
  3. ARIMA (2,1,0) với Độ lệch; AIC = 281,437

Tất cả ba mô hình được xem xét cho thấy dư lượng tiếng ồn trắng:

nhập mô tả hình ảnh ở đây

Câu hỏi tóm tắt của tôi là:

  1. Bạn vẫn có thể mô tả ACF của chuỗi thời gian là cắt giảm mặc dù các xung đột xung quanh độ trễ 26?
  2. Những điều này có phải là một chỉ số cho thấy một mô hình ARMA hỗn hợp có thể phù hợp hơn không?
  3. Tôi nên chọn tiêu chí thông tin nào? AIC? AICC?
  4. Phần dư của ba mô hình có AIC cao nhất đều thể hiện hành vi nhiễu trắng, nhưng sự khác biệt trong AIC chỉ rất nhỏ. Tôi có nên sử dụng thông số có ít tham số nhất, ví dụ ARIMA (0,1,1) không?
  5. Lập luận của tôi nói chung có hợp lý không?
  6. Là những khả năng xa hơn của họ để xác định mô hình nào có thể tốt hơn hay tôi nên lấy ví dụ, hai mô hình có AIC cao nhất và thực hiện các cuộc kiểm tra ngược để kiểm tra tính hợp lý của các dự báo?

EDIT: Đây là dữ liệu của tôi:

-5.9112948202 -5.3429985122 -4.7382340534 -3.1129015623 -3.0350910288 -2.3218904871 -1.7926701792 -1.1417358384 -0.6665592055 -0.2907748318 0.2899480865 0.4637205370  0.5826312749  0.3869227286  0.6268379174  0.7439125292 0.7641139207  0.7613140511  3.0143912244 -0.7339255839  2.0109976796 0.8282394650 -2.5668367983  5.9826406394  1.9569198553  2.3860893476 2.0883339390  1.9761894580  2.2601997245  2.2464027995  2.5131158613 3.4564765529  4.2307335557  4.0298688374  3.7626317439  3.1026407174 2.1690168737  1.5617407254  2.6790460788  0.4652054768 -0.0501046517 -1.0157683791 -0.5113698054 -0.0180401353 -1.9471272198 -0.2550365250 -1.1269988523  0.5152074134  0.2362626753 -2.9978337017  1.4924705528 -1.4907767844 -0.5492041416 -0.7313021018 -0.6531515868 -0.4094159299 -0.5525401626 -0.0611454515 -0.5256272882 -1.1235247363 -1.7299848758 -1.3807763611 -1.6999054476 -4.3155973110 -4.7843298990

Câu trả lời:


4

1) Bạn vẫn có thể mô tả ACF của chuỗi thời gian là cắt giảm mặc dù các xung đột xung quanh độ trễ 26?

26 và 27 gợi ý cho tôi rằng dữ liệu là hàng tuần một số thứ tự pf chu kỳ hàng năm 26 hoặc 52

Những điều này có phải là một chỉ số cho thấy một mô hình ARMA hỗn hợp có thể phù hợp hơn không?

Nếu có các ngoại lệ trong chuỗi được quan sát thì mô hình ARIMA sẽ trở thành Mô hình hàm truyền với các đầu vào giả.

Các ngoại lệ trong acf / pacf thường không thể giải thích được. Rove sử dụng acf / paf của một mô hình dự kiến ​​được đề xuất bởi acf / pacf abd chiếm ưu thế sau đó ITERATE thành một mô hình phức tạp hơn.

Tôi nên chọn tiêu chí thông tin nào? AIC? AICC? Phần dư của ba mô hình có AIC cao nhất đều thể hiện hành vi nhiễu trắng, nhưng sự khác biệt trong AIC chỉ rất nhỏ. Tôi có nên sử dụng thông số có ít tham số nhất, ví dụ ARIMA (0,1,1) không?

Không có gì vì nó dựa trên một bộ thử nghiệm các mô hình giả định.

Lập luận của tôi nói chung có hợp lý không? Câu hỏi mơ hồ ... thậm chí trả lời vaguer.

Là những khả năng xa hơn của họ để xác định mô hình nào có thể tốt hơn hay tôi nên lấy ví dụ, hai mô hình có AIC cao nhất và thực hiện các cuộc kiểm tra ngược để kiểm tra tính hợp lý của các dự báo?

Đơn giản chỉ cần ITERATE (từ từ!) Cho các mô hình phức tạp hơn / ít hơn kết hợp cả cấu trúc tự động lấy lại và cấu trúc xác định. Xem http://www.autobox.com/cms/index.php/blog/entry/build-or-make-your-own-arima-forecasting-mode để biết sơ đồ luồng logic

CHỈNH SỬA SAU KHI NHẬN DỮ LIỆU:

Tôi đã nhầm lẫn với nhận xét của bạn, bạn đã sử dụng độ trễ từ 26 và tôi hiểu không chính xác bạn đang nói về acf nhưng bạn đang nói về thời điểm 26. Một bộ dữ liệu có thể không cố định theo một số cách. Nếu giá trị trung bình thay đổi phương thuốc cho sự không cố định này là không có nghĩa. Trong trường hợp của bạn, sự không ổn định được gây ra bởi hai xu hướng riêng biệt và khác biệt và một sự gia tăng đáng kể về phương sai lỗi. Cả hai phát hiện này đều dễ dàng được hỗ trợ bởi mắt.nhập mô tả hình ảnh ở đây

Dữ liệu của bạn không ổn định nhưng biện pháp khắc phục cho tình trạng không ổn định trong dữ liệu của bạn không phải là khác biệt mà là xu hướng vì hai xu hướng được tìm thấy (1-29 và 30-65) được tìm thấy qua Phát hiện can thiệp. Hơn nữa, phương sai lỗi của bạn không tăng đáng kể ở giai đoạn 28 được tìm thấy qua thử nghiệm của Tsay về phương sai lỗi không liên tục, Xem tham chiếu này cho cả hai quy trình http://www.unc.edu/~jbhill/tsay.pdf . Sau khi điều chỉnh hai xu hướng và thay đổi phương sai lỗi và một vài xung, một mô hình AR (1) đơn giản đã được tìm thấy là đầy đủ. Dưới đây là cốt truyện của Thực tế / Phù hợp / Dự báo. Equa nhập mô tả hình ảnh ở đâytion ở đây với kết quả ước tính ở đây nhập mô tả hình ảnh ở đây. Thử nghiệm thay đổi phương sai là ở đây nhập mô tả hình ảnh ở đâyvà âm mưu của phần dư của mô hình ở đâynhập mô tả hình ảnh ở đây. Tôi đã sử dụng AUTOBOX một phần mềm mà tôi đã giúp phát triển để tự động tách tín hiệu khỏi nhiễu. Tập dữ liệu của bạn là "poster boy" cho lý do tại sao mô hình ARIMA đơn giản không được sử dụng rộng rãi vì các phương pháp đơn giản không hoạt động đối với các vấn đề phức tạp. Lưu ý rằng sự thay đổi về phương sai lỗi không thể liên kết với mức độ của chuỗi quan sát, do đó các biến đổi công suất như nhật ký không liên quan ngay cả khi các bài báo được xuất bản trình bày mô hình sử dụng cấu trúc đó. Xem Nhật ký hoặc chuyển đổi căn bậc hai cho ARIMA để biết thảo luận về thời điểm thực hiện chuyển đổi năng lượng.

nhập mô tả hình ảnh ở đây


Cảm ơn rất nhiều cho các ý kiến ​​hữu ích. Thật không may, chuỗi thời gian biểu thị các tham số ước tính của mô hình (tỷ lệ tử vong-) trong một phạm vi năm. Vì vậy, tôi không nghĩ bao gồm các thành phần theo mùa có thể giải quyết vấn đề này. Về quan điểm của bạn bắt đầu từ một mô hình dự kiến ​​đơn giản và sau đó lặp lại nó thành một mô hình phức tạp hơn: Nhìn vào ACF và PACF của phần dư của ARIMA (0,1,1), chúng cho thấy hành vi của WN. Loại mô hình nào tôi bỏ lỡ sẽ làm nổi bật sự cần thiết của một mô hình phức tạp hơn? Btw, tôi vừa thêm dữ liệu của tôi.
Thống kê_L

Cảm ơn rất nhiều cho nỗ lực và ý kiến ​​của bạn. Điều thú vị là, các tham số biểu thị hiệu ứng đoàn hệ của các mô hình tử vong, thường được mô hình hóa như một mô hình ARIMA (p, d, q) đơn giản trong tài liệu, xem ví dụ pensions
inst acad.org/ Workepage / wp0801.pdf

Từ khóa ở đây là "đơn giản". Chuyên gia tính toán, mặc dù các nhà toán học có năng khiếu, không nhất thiết phải là người tiên tiến trong phân tích chuỗi thời gian. Phân tích tốt trình bày các bài kiểm tra về ý nghĩa và sự đầy đủ cho thấy các bài kiểm tra về các giả định. Bạn có thể chuyển những kết quả này cho các tác giả và nhận phản hồi của họ hoặc ít nhất là tín dụng để mở rộng ý thức của họ.
IrishStat

Điều này sẽ giải thích tại sao việc lựa chọn một mô hình ARIMA (p, d, q) nhất định thường chỉ dựa trên các giá trị AIC (hoặc ít nhất là các kiểm tra thêm không được đề cập và mô tả chi tiết). Nếu bạn sẽ tìm thấy thời gian trong những ngày tiếp theo, tôi sẽ rất quan tâm đến ý kiến ​​của bạn về chuỗi lần thứ hai của tôi, tôi phải dự báo và đi bộ ngẫu nhiên với sự trôi dạt có thể phù hợp. Nó có thể được tìm thấy ở đây: stats.stackexchange.com/questions/161571/ Kẻ
Stats_L
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.