Auto.arima vs autobox có khác nhau không?


16

Từ việc đọc các bài đăng trên trang web này, tôi biết có một hàm R auto.arima(trong forecast gói ). Tôi cũng biết rằng IrishStat , một thành viên của trang web này được xây dựng gói thương mại autobox trong đầu những năm 1980. Vì hai gói này tồn tại ngày nay và tự động chọn các mô hình arima cho các tập dữ liệu đã cho, chúng làm gì khác nhau? Họ có thể tạo ra các mô hình khác nhau cho cùng một tập dữ liệu không?


Cảm ơn đã chỉnh sửa @Wayne. Tôi không quen thuộc với gói dự báo R nhưng tôi chắc chắn đó là những gì tôi muốn so sánh với autobox.
Michael R. Chernick

(Tôi vừa thực hiện một thay đổi nhỏ thứ hai của "auto-arima" thành "auto.arima".) Có thể có các auto.arimachức năng khác trong các gói khác, nhưng chắc chắn có một trong đó forecast, mô tả là: "Trả về mô hình ARIMA tốt nhất theo theo giá trị AIC, AICc hoặc BIC. Hàm này thực hiện tìm kiếm trên mô hình có thể trong các ràng buộc thứ tự được cung cấp. "
Wayne

1
AUTOBOX xử lý nhận dạng tự động một cách toàn diện bằng cách lặp lại mặc dù nhận dạng tự động bằng cách thực sự ước tính và sau đó thực hiện các thủ tục chẩn đoán bước và xuống để đưa ra một mô hình chỉ có các tham số có ý nghĩa thống kê trong khi có quá trình lỗi không có cấu trúc xác định Theo cách này, nó tuân theo kịch bản lặp. Các phiên bản ban đầu của AUTOBOX vào khoảng năm 1975 đã cố gắng sử dụng "một cách tiếp cận thống kê" nhưng điều này được tìm thấy là muốn các mô hình được xác định có cấu trúc dự phòng hoặc ngớ ngẩn (ví dụ 5,1,2) hoặc cấu trúc không rõ ràng.
IrishStat

1
@IrishStat Nghe có vẻ như là một cách tiếp cận tốt. Bạn sẽ làm gì nếu bạn tìm thấy hai mô hình cạnh tranh đáp ứng yêu cầu của bạn. Có vẻ như sở hữu. Bạn có đề xuất một mô hình "tối ưu" dựa trên các tiêu chí cụ thể không? Tôi nhận thấy rằng việc chọn một mô hình chỉ có "tham số có ý nghĩa thống kê" có thể có xu hướng ủng hộ phân tích Nhưng không thể có quy trình AR thông số thấp và mô hình Aema bậc thấp khác trong đó tất cả các tham số đều có ý nghĩa thống kê và phần dư trông giống như màu trắng tiếng ồn?
Michael R. Chernick

1
@IriehStat. Tôi đồng ý với bạn. Cuối cùng, bạn làm gì cho người dùng. Bạn có cung cấp chỉ một mô hình hoặc bạn có thể đưa ra một danh sách sắp xếp các mô hình có thể chấp nhận được không? Nếu không phải cái sau thì có lẽ đó là một lựa chọn tốt để thêm vào nơi bạn giới hạn danh sách ở một số nhỏ.
Michael R. Chernick

Câu trả lời:


9

michael / wayne

AUTOBOX chắc chắn sẽ phân phối / xác định một mô hình khác nếu đáp ứng một hoặc nhiều điều kiện sau đây

1) có các xung trong dữ liệu

2) có 1 hoặc nhiều mức thay đổi / bước trong dữ liệu

3) nếu có các xung theo mùa trong dữ liệu

4) có 1 hoặc nhiều xu hướng thời gian cục bộ trong dữ liệu không chỉ được khắc phục

5) nếu các tham số của mô hình thay đổi theo thời gian

6) nếu phương sai của các lỗi thay đổi theo thời gian và không có sự biến đổi công suất nào là đủ.

Về một ví dụ cụ thể, tôi sẽ đề nghị cả hai bạn chọn / tạo một chuỗi thời gian và đăng cả hai lên web. Tôi sẽ sử dụng AUTOBOX để phân tích dữ liệu ở chế độ không giám sát và tôi sẽ đăng các mô hình vào danh sách. Sau đó, bạn chạy chương trình R và sau đó mỗi bạn thực hiện một phân tích khách quan riêng biệt về cả hai kết quả, chỉ ra những điểm tương đồng và khác biệt. Gửi hai mô hình hoàn chỉnh với tất cả các tài liệu hỗ trợ có sẵn bao gồm các điều khoản lỗi cuối cùng cho tôi để nhận xét. Tóm tắt và trình bày các kết quả này vào danh sách và sau đó hỏi độc giả của danh sách để BẦU cho thủ tục nào có vẻ tốt nhất đối với họ.


Bạn có nghĩa là một cuộc thi như thế này ?
whuber

@whuber Có. Thậm chí có thể sử dụng một số "ví dụ cuốn sách văn bản không xác định / mã hóa" có thể được sử dụng làm nền.
IrishStat

22

Họ đại diện cho hai cách tiếp cận khác nhau cho hai vấn đề tương tự nhưng khác nhau. Tôi đã viết auto.arimavà @IrishStat là tác giả của Autobox.

auto.arima()phù hợp (theo mùa) mô hình ARIMA bao gồm các điều khoản trôi dạt. Autoboxphù hợp với các mô hình chức năng chuyển để xử lý các mức dịch chuyển và ngoại lệ. Mô hình ARIMA là trường hợp đặc biệt của mô hình hàm truyền.

Ngay cả khi bạn tắt dịch chuyển cấp và phát hiện ngoại lệ Autobox, bạn sẽ nhận được một mô hình ARIMA khác auto.arima()do các lựa chọn khác nhau trong cách xác định các tham số ARIMA.

Trong thử nghiệm của tôi về dữ liệu cạnh tranh M3 và M, auto.arima()tạo ra các dự báo chính xác hơn so Autoboxvới các dữ liệu này. Tuy nhiên, Autoboxsẽ làm tốt hơn với dữ liệu chứa các ngoại lệ chính và thay đổi cấp độ.


3
Tôi tin rằng bạn đã đề cập đến một phiên bản AUTOBOX từ nhiều, nhiều năm trước. AUTOBOX đã thay đổi đáng kể trong nhiều năm qua. Nếu tôi không sai, bạn chỉ so sánh độ chính xác từ 1 nguồn gốc mà tôi chắc chắn bạn sẽ đồng ý là một mẫu 1. Độ chính xác cần được đánh giá từ một số nguồn gốc.
IrishStat

15
Tôi đang đề cập đến các so sánh được công bố trên hàng ngàn loạt. Là Tổng biên tập của Tạp chí Dự báo Quốc tế, tôi nghĩ rằng tôi có một số ý tưởng về cách đánh giá dự báo.
Rob Hyndman

2
Tôi không có ý định cho câu hỏi này để đưa ra lập luận về việc ai có thuật toán dự báo tốt nhất. Tôi nghĩ cả autobox và auto.arima có lẽ là những gói rất tốt. So sánh trực tiếp có thể không công bằng vì nhiều lý do. 1) Người dùng có thể không đủ chuyên môn để biết cách đánh giá họ. 2) Độ chính xác dự báo trên một chuỗi thời gian duy nhất là một cảnh tào lao. Người ta có thể có một lỗi bình phương trung bình thấp hơn trong dự đoán, nhưng bất cứ khi nào có sự ngẫu nhiên có liên quan thì nó phải được tính đến. Bạn cần xem xét một số loạt và như IrishStat gợi ý bạn nên xem xét các điểm bắt đầu khác nhau.
Michael R. Chernick

Ngoài ra các điểm khác nhau để bắt đầu dự báo sẽ hữu ích. 3) Trong thế giới ARIMA có nhiều biểu diễn cho cùng một mô hình chuỗi thời gian, các quy trình AR hữu hạn có các biểu diễn trung bình di chuyển vô hạn và ngược lại. Vì vậy, AR bậc thấp có thể gần giống với trung bình di chuyển bậc cao hoặc ARMA. Hộp luôn được đề xuất theo nguyên tắc phân tích. Nhưng nếu bạn có nhiều dữ liệu, bạn có thể nhận được các ước tính tốt về các tham số và mô hình thứ tự cao có thể tạo ra gần như các dự báo tương tự như mô hình đáng chú ý. 4) Hai gói có mục tiêu khác nhau.
Michael R. Chernick

3
Phương pháp đã phát triển theo thời gian. Dave Reilly rất tích cực trên trang web này với tên IrishStat và anh ấy đã rất cởi mở về việc giải thích cách thức hoạt động của nó trong điều khoản chung. Đó là một khía cạnh thiết yếu của kinh doanh để có bí mật thương mại và thuật toán độc quyền. Từ quan điểm của anh ấy, R đang làm tổn thương doanh nghiệp của anh ấy giống như đối với SPlus. Nhưng anh ấy không thể hiện sự cay đắng và rất sẵn lòng thể hiện phần mềm của mình như bạn có thể thấy anh ấy đã làm ngày hôm nay. Anh ấy cũng sẵn sàng chạy thử nghiệm chống lại các đối thủ cạnh tranh và tôi tin rằng anh ấy đã tham gia các cuộc thi dự báo theo chuỗi thời gian.
Michael R. Chernick

11

EDIT: Theo nhận xét của bạn, tôi tin rằng nếu bạn tắt nhiều autoboxtùy chọn, có lẽ bạn sẽ nhận được câu trả lời tương tự auto.arima. Nhưng nếu bạn không, và với sự hiện diện của các ngoại lệ chắc chắn sẽ có một sự khác biệt: auto.arimakhông quan tâm đến các ngoại lệ, trong khi autoboxsẽ phát hiện ra chúng và xử lý chúng một cách thích hợp, sẽ đưa ra một mô hình tốt hơn. Có thể có những khác biệt nữa, và tôi chắc chắn IrishStat có thể mô tả những điều đó.


Tôi tin rằng autoboxphát hiện các ngoại lệ và những thứ khác ngoài việc tìm kiếm các hệ số AR, I và MA tốt nhất. Nếu điều đó đúng, nó sẽ yêu cầu phân tích nhiều hơn và một vài hàm R khác có chức năng tương tự. Và IrishStats là một thành viên có giá trị của cộng đồng này, và khá thân thiện.

Tất nhiên, R là miễn phí và có thể làm được rất nhiều thứ ngoài ARIMA.

Một lựa chọn khác miễn phí cho ARIMA theo phong cách kinh tế là X13-ARIMA SEATS, từ Cục điều tra dân số Hoa Kỳ, là nguồn mở. Có các tệp nhị phân cho Windows và Linux, nhưng nó được biên dịch đơn giản trên máy Mac của tôi, với điều kiện là tôi đã tải trình biên dịch gfortran của gnu. Đó là sự kế thừa X12-ARIMAvà chỉ được phát hành trong vài ngày qua, sau nhiều năm phát triển và thử nghiệm. (Nó cập nhật X12 và cũng bổ sung các tính năng SEATS / TRAMO. X12 là công cụ chính thức của Hoa Kỳ, trong khi SEATS / TRAMO đến từ Ngân hàng Tây Ban Nha và là "công cụ châu Âu".)

Tôi thực sự thích X12 (và bây giờ là X13) rất nhiều. Nếu bạn đưa ra một số lượng chẩn đoán hợp lý và đọc qua chúng và tìm hiểu ý nghĩa của chúng, thì chúng thực sự là một nền giáo dục khá tốt trong ARIMA và chuỗi thời gian. Tôi đã phát triển quy trình làm việc của riêng mình, nhưng có gói R x12để thực hiện hầu hết công việc từ bên trong R (bạn vẫn phải tạo tệp mô hình đầu vào (".spc") cho X12).

Tôi nói X12 rất giỏi về "phong cách kinh tế" ARIMA có nghĩa là dữ liệu hàng tháng với hơn 3 năm dữ liệu. (Bạn cần hơn 5 năm dữ liệu để sử dụng một số tính năng chẩn đoán.) Nó có tính năng nhận dạng ngoại lệ, có thể xử lý tất cả các loại thông số kỹ thuật ngoại lệ và có thể xử lý các ngày lễ, ngày lễ trôi nổi, hiệu ứng ngày giao dịch và một loạt các điều kinh tế. Đây là công cụ mà chính phủ Hoa Kỳ sử dụng để tạo dữ liệu điều chỉnh theo mùa.


Câu hỏi của tôi đã thực sự được đưa ra một tập dữ liệu, hai thuật toán có thể tạo ra các lựa chọn mô hình khác nhau. Nó thực sự là phần cắt tự động mà tôi quan tâm và không yêu cầu các tính năng chẩn đoán khác mà người ta có thể cho rằng người kia không có. Được biết, họ mô hình ARMA và hai mô hình trong gia đình có thể là đại diện thay thế chính xác hoặc gần như chính xác của cùng một mô hình. Vì vậy, nếu có sự khác biệt nhỏ trong các thủ tục lựa chọn, tôi nghĩ họ có thể đưa ra các lựa chọn mô hình khác nhau.
Michael R. Chernick

3
@MichaelCécick: À. Tôi đoán sẽ là nếu bạn tắt tất cả các công cụ tự động trong autoboxbạn sẽ nhận được cùng một câu trả lời. Nhưng một trong những điểm của việc sử dụng autoboxlà nó sẽ phát hiện các ngoại lệ và xử lý chúng như vậy, do đó mô hình được trả về sẽ khác nếu có các ngoại lệ.
Wayne

@Wayne +1 để biết thêm thông tin về X13-ARIMA SEATS và SEATS / TRAMO.
Graeme Walsh

@Wayne Nhân tiện, một "Công cụ Châu Âu" khác là DEMETRA + .
Graeme Walsh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.