Phân tích tỷ lệ bất biến của chuỗi thời gian


8

Khi phát triển một phần mềm chuỗi thời gian có mục đích chung, nó có phải là một ý tưởng tốt để làm cho nó có quy mô bất biến? Làm thế nào một người sẽ làm điều đó?

Tôi mất một chuỗi thời gian khoảng 40 điểm, sau đó nhân với các yếu tố từ 10E-9 đến 10E3 và sau đó chạy qua các chức năng ARIMA của Dự báo Pro và Minitab. Trong Dự báo Pro, tất cả đều dẫn đến cùng một câu trả lời (mô hình tự động), trong khi ở Minitab, chúng không như vậy. Không chắc chắn Dự báo Pro làm gì, nhưng họ có thể chỉ tăng hoặc giảm tất cả các con số theo một tỷ lệ nhất định (giả sử 100 giây) trước khi chạy mô hình. Đây có phải là ý tưởng tốt nói chung?

Câu trả lời:


7

Nếu phần mềm tính tổng các lỗi bình phương trong tối ưu hóa (và hầu hết sẽ), thì bạn có thể gặp rắc rối với số lượng rất lớn hoặc số rất nhỏ do cách lưu trữ số dấu phẩy động. Điều tương tự cũng áp dụng cho bất kỳ mô hình thống kê nào, không chỉ phân tích chuỗi thời gian. Một cách để tránh vấn đề là chia tỷ lệ dữ liệu trước khi chạy mô hình, sau đó chia tỷ lệ lại kết quả. Đối với hầu hết các mô hình chuỗi thời gian, bao gồm tất cả các mô hình tuyến tính, sẽ hoạt động. Tuy nhiên, một số mô hình phi tuyến sẽ không mở rộng.

Khi tôi phân tích dữ liệu, tôi sẽ thường tự điều chỉnh dữ liệu, không chỉ để ngăn ngừa các vấn đề tối ưu hóa có thể xảy ra mà còn để làm cho biểu đồ và bảng dễ đọc hơn.


1
Ngoài ra, bạn có thể muốn xem mọi nhà khoa học máy tính nên biết gì về số học dấu phẩy động, David Goldberg để được tư vấn về cách xử lý các vấn đề về biểu diễn số.
đánh dấu

@Rob: Cảm ơn câu trả lời. Tôi đoán bạn sau đó ngụ ý rằng việc mở rộng chuỗi trước khi phân tích là ổn.
Samik R

@fmark: Cảm ơn bạn đã bình luận - Tôi thực sự khá quen thuộc về tài liệu đó.
Samik R

@Samik: Đối với các mô hình tuyến tính như các quy trình ARIMA của Gaussian, vâng.
Rob Hyndman

3
Trong giới hạn rộng lớn, tỷ lệ không tạo ra sự khác biệt nào cho các phép tính dấu phẩy động: nó chỉ đơn giản là một sự thay đổi của số mũ mà không làm mất độ chính xác. Trong đó tỷ lệ có thể giúp là nơi tính toán liên quan đến các tập hợp dữ liệu nằm trên các thang đo khác nhau. Tôi đoán là các công thức chuỗi thời gian đang sử dụng một số phép đo thời gian (mili giây? Năm? Chỉ là các bước tích phân?) Có thể có phạm vi cực kỳ khác so với phạm vi của dữ liệu. Chỉ số tốt SW sẽ nội bộ quy mô ma trận của nó để tránh mất độ chính xác; điều này có thể giải thích sự khác biệt giữa FP và Minitab.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.