Mô hình chuỗi thời gian tập hợp


13

Tôi cần tự động hóa dự báo chuỗi thời gian và tôi không biết trước các tính năng của chuỗi đó (tính thời vụ, xu hướng, tiếng ồn, v.v.).

Mục đích của tôi không phải là để có được mô hình tốt nhất có thể cho mỗi loạt, mà là để tránh các mô hình khá xấu. Nói cách khác, để có được lỗi nhỏ mỗi lần không phải là vấn đề, nhưng thỉnh thoảng lại gặp lỗi lớn.

Tôi nghĩ rằng tôi có thể đạt được điều này bằng cách kết hợp các mô hình được tính toán với các kỹ thuật khác nhau.

Đó là, mặc dù ARIMA sẽ là cách tiếp cận tốt nhất cho một loạt cụ thể, nhưng nó có thể không phải là cách tốt nhất cho một loạt khác; tương tự cho làm mịn theo cấp số nhân.

Tuy nhiên, nếu tôi kết hợp một mô hình từ mỗi kỹ thuật, ngay cả khi một mô hình không tốt, mô hình kia sẽ đưa ước tính gần hơn với giá trị thực.

Người ta biết rằng ARIMA hoạt động tốt hơn đối với các chuỗi hoạt động tốt trong thời gian dài, trong khi làm mịn theo cấp số nhân nổi bật với các chuỗi nhiễu ngắn hạn.

  • Ý tưởng của tôi là kết hợp các mô hình được tạo ra từ cả hai kỹ thuật để có được dự báo mạnh mẽ hơn, liệu nó có ý nghĩa?

Có thể có nhiều cách để kết hợp những mô hình đó.

  • Nếu đây là một cách tiếp cận tốt, tôi nên kết hợp chúng như thế nào?

Một dự báo đơn giản là một lựa chọn, nhưng có lẽ tôi có thể có được những dự đoán tốt hơn nếu tôi cân nhắc giá trị trung bình theo một số đo lường mức độ tốt của mô hình.

  • Điều gì sẽ được điều trị phương sai khi kết hợp các mô hình?

Ý tưởng của bạn nghe có vẻ hay, nhưng tôi không chắc về việc sử dụng các mô hình ARIMA tự động . Đối với loạt đơn biến có lẽ ... Sự khôn ngoan thông thường là Holt-Winters được sử dụng khá tự động, do đó, đó có thể là cơ sở của bạn để so sánh ngoài mẫu giữa các phương pháp.
Scortchi - Phục hồi Monica

@Scortchi Tôi quên đề cập rằng tất cả các bộ đều là đơn biến! ;) Tôi đồng ý rằng Holt-Winters hoạt động thực sự tốt khi được sử dụng tự động, nhưng tôi dự định lấy thêm một ý kiến ​​từ một mô hình khác, để tránh các trường hợp dự báo không tốt lắm. Đôi khi CTNH cho thấy hành vi xu hướng kỳ lạ.
João Daniel

1
Ngay cả trong trường hợp đơn biến, tôi đấu tranh để tưởng tượng một quy trình tự động - có xu hướng (ngẫu nhiên hoặc xác định), các biến đổi có thể, tính thời vụ (nhân hoặc cộng) để suy nghĩ, và tôi thấy rằng để có được một mô hình tôi sử dụng nhiều kiến ​​thức trước đó về những gì sẽ hợp lý cho những gì một loạt cụ thể đại diện trong thực tế. Tuy nhiên, bằng chứng của bánh pudding là trong việc ăn uống - tôi thực sự chỉ muốn nói đừng quên thực hiện các so sánh ngoài mẫu với các kỹ thuật đơn giản - thật may mắn với nó.
Scortchi - Phục hồi Monica

Câu trả lời:


15

Kết hợp dự báo là một ý tưởng tuyệt vời. (Tôi nghĩ rằng đó không phải là một cường điệu khi nói rằng đây là một trong số ít những điều mà các nhà dự báo học thuật đồng ý.)

Tôi tình cờ đã viết một bài báo trước đây về các cách khác nhau để dự báo trọng số khi kết hợp chúng: http://www.scTHERirect.com/science/article/pii/S0169207010001032 Về cơ bản, sử dụng trọng lượng (Akaike) không nhất quán cải thiện các kết hợp trên các phương tiện hoặc trung bình đơn giản hoặc được cắt xén / thắng, vì vậy cá nhân tôi sẽ suy nghĩ kỹ trước khi thực hiện một quy trình phức tạp có thể không mang lại lợi ích nhất định (tuy nhiên, việc kết hợp đó luôn vượt trội so với các phương pháp lựa chọn theo tiêu chí thông tin). Điều này có thể phụ thuộc vào chuỗi thời gian cụ thể mà bạn có, tất nhiên.

Tôi đã xem xét kết hợp các khoảng dự đoán trong bài báo ở trên, nhưng không phải là kết hợp phương sai như vậy. Tôi dường như nhớ lại một bài báo không dài trong IJF với trọng tâm này, vì vậy bạn có thể muốn tìm kiếm "kết hợp" hoặc "kết hợp" thông qua các vấn đề trở lại của IJF.

Một vài bài báo khác đã xem xét kết hợp các dự báo ở đây (từ năm 1989, nhưng đánh giá)ở đâyở đây (cũng xem xét mật độ)ở đâyđây. Nhiều người trong số này lưu ý rằng vẫn chưa hiểu rõ tại sao các kết hợp dự báo thường xuyên vượt trội hơn các mô hình được chọn duy nhất. Bài viết thứ hai đến cuối cùng là về cuộc thi dự báo M3; một trong những phát hiện chính của họ là (số (3) trên trang 45) rằng "Độ chính xác của sự kết hợp các phương pháp khác nhau vượt trội hơn, trung bình, các phương pháp cụ thể được kết hợp và so sánh tốt với các phương pháp khác." Bài báo cuối cùng cho thấy các kết hợp không nhất thiết phải hoạt động tốt hơn các mô hình đơn lẻ, nhưng chúng có thể làm giảm đáng kể nguy cơ thất bại thảm khốc (là một trong những mục tiêu của bạn). Nhiều tài liệu nên được tìm thấy trong Tạp chí Dự báo Quốc tế , Tạp chí Dự báo và cho các ứng dụng cụ thể hơn trong kinh tế lượng hoặc tài liệu chuỗi cung ứng.


1
Quan điểm tuyệt vời về việc kết hợp các mô hình! Câu trả lời của bạn rất mang tính xây dựng!
João Daniel

@Stephan Kolassa, bạn có nhận xét gì về việc kết hợp các yếu tố dự đoán tiến và lùi, như trong phương pháp của Burg không?
denis

@denis: Tôi không quen thuộc với các dự đoán tiến hoặc lùi, cũng như phương pháp của Burg, xin lỗi ... mặc dù tôi cho rằng việc kết hợp các dự báo / dự đoán (còn gọi là phương pháp tập hợp) thường sẽ có lợi.
Stephan Kolassa

Xin chào Stephan, bài viết tuyệt vời. Có vẻ như trang web tạp chí đã thay đổi và có vẻ như không thể tải xuống mã R của bạn từ trang web chính nữa. Là lưu trữ nó trên một trang web khác nhau bây giờ?
Ian

@Ian: bạn có thể không có quyền truy cập nếu bạn không đăng ký. Gửi cho tôi một email ( tìm địa chỉ của tôi ở đây ), tôi sẽ gửi các tập lệnh qua. Hãy cho tôi một vài ngày để đào chúng lên.
Stephan Kolassa

1

Tại sao không chỉ định thêm? Tôi không nghĩ rằng bất kỳ một mô hình nào bạn sẽ sản xuất có thể tốt hơn hoặc đủ tốt hơn một lựa chọn cụ thể.

Như đã nói, nếu bạn có thể thu hẹp lựa chọn của mình một chút cho những lựa chọn mà bạn có thể kiểm tra và dữ liệu đầu vào có thể được chuẩn hóa, vậy tại sao bạn không viết quy trình kiểm tra tự động trong R?

Giả sử bạn quyết định dữ liệu của mình sẽ nằm trong phạm vi được ước tính theo năm mô hình cũng như một "dự phòng". Nói rằng bạn có thể đặc trưng hóa đầu vào bằng các thử nghiệm khác nhau. Sau đó, chỉ cần tiếp tục và viết một thuật toán R (hoặc một chương trình như vậy) chạy nó cho bạn. Điều này hoạt động nếu bạn có thể tạo ra một sơ đồ mô hình nào sẽ chạy dựa trên dữ liệu thử nghiệm, đó là nếu bất kỳ điểm nào của cây quyết định là nhị phân.

Nếu đây không phải là một lựa chọn vì quyết định có thể không phải là nhị phân, tôi khuyên bạn nên triển khai hệ thống xếp hạng dựa trên các thử nghiệm áp dụng và chạy một số "trường hợp cực đoan" dữ liệu mô phỏng qua lưới của bạn để xem kết quả có phải là điều bạn đang tìm kiếm không.

Bạn có thể kết hợp những thứ này một cách rõ ràng, ví dụ, việc kiểm tra tính không cố định có thể được đưa ra một cách xác định có - không, trong khi các thuộc tính khác có thể rơi vào một phạm vi như đa cộng tuyến.
Bạn có thể vẽ nó ra giấy trước, sau đó xây dựng nó, mô phỏng nó với các bản phân phối đã biết mà bạn mong muốn có.

Sau đó, chỉ cần chạy chương trình R mỗi khi có dữ liệu mới. Tôi thấy không cần kết hợp một số mô hình với các khả năng tính toán mà bạn có khả năng có trong tay.


Thu hẹp các lựa chọn xuống là một ý tưởng tốt, như không sử dụng các phương pháp không theo mùa nếu dữ liệu rõ ràng là theo mùa. Nhưng ngay cả khi đó, tôi sẽ lập luận rằng việc tính trung bình nhiều mô hình theo mùa (cộng gộp so với tính thời vụ nhân, có hoặc không có xu hướng, v.v.) sẽ trung bình cải thiện độ chính xác dự báo. Ít nhất đó là ấn tượng tôi có được từ một chút tiếp xúc với cộng đồng dự báo cũng như đối với M3 và các cuộc thi dự báo tương tự.
Stephan Kolassa

Bạn có giấy tờ bổ sung về điều này? Ý tôi là đây sẽ là một đề tài nghiên cứu đơn giản nhưng có liên quan. Ý tưởng rất thú vị, mặc dù theo trực giác tôi không đồng ý rằng nó nhất thiết phải tốt hơn một mạng lưới mô hình động.
IMA

Điểm tốt. Tôi đã chỉnh sửa câu trả lời của mình để bao gồm một đoạn bổ sung với nhiều gợi ý văn học hơn. Tôi đồng ý rằng điều này là đơn giản và có liên quan, và vẫn chưa hiểu rõ tại sao dự báo trung bình thường cải thiện độ chính xác.
Stephan Kolassa

Vâng, ý tôi là bạn có thể mô hình hóa tất cả các loại vấn đề phân phối và tấn công nó một cách tính toán và cơ bản. Cảm ơn các giấy tờ, rất thú vị.
IMA

0

Có một công thức hay và đơn giản để kết hợp hai phương pháp dự báo, bạn chỉ cần cân chúng nhân số đầu tiên với a và phương pháp khác (1 - a), trong đó a được tìm thấy bằng cách giảm thiểu phương sai của dự báo kết hợp này. Như bạn đã biết lỗi của cả hai phương pháp dự báo, bạn có thể tính toán các lỗi của kết hợp sẽ phụ thuộc vào "a". Phép tính đơn giản khi giá trị trung bình của mỗi phương thức là = 0. Để kết hợp nhiều hơn 2 phương thức, các công thức vẫn "đơn giản" theo nghĩa là bạn có thể tính toán nó bằng tay "bằng tay" hoặc cũng có thể sử dụng tùy chọn Bộ giải từ EXCEL


Bạn có thể đưa ra tài liệu tham khảo cho phương pháp này.
horaceT
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.