Đo lường mức độ biến động của dữ liệu chuỗi thời gian?


11

Tôi muốn tính toán một số phép đo độ biến động hoặc nhiễu cho dữ liệu chuỗi thời gian đứng yên. Đây có thể là thước đo cho một chuỗi thời gian đơn lẻ hoặc thước đo tương đối so sánh nhiều chuỗi thời gian với nhau. Giả sử thử nghiệm Dickey-Fuller đã được tiến hành và tất cả các chuỗi thời gian không có gốc đơn vị.

Một số ví dụ về các số liệu như vậy để đo tiếng ồn / biến động là gì? Tôi đã xem xét "hệ số biến thiên" đơn giản là SD / trung bình. Tuy nhiên, tôi tự hỏi nếu có những cách khác để đo lường điều này. Nếu nó giúp, tôi sử dụng R.

Tôi biết đây là một yêu cầu mơ hồ, và tôi xin lỗi. Tôi thực sự sẽ đánh giá cao bất kỳ đề xuất hoặc nguồn để tìm hiểu về chủ đề này.

Câu trả lời:


4

Trong tài chính, thước đo độ biến động là độ lệch chuẩn của chuỗi. Các phương tiện thường gần bằng 0, ví dụ lợi nhuận về giá, vì vậy nó không phải là hệ số biến đổi thường.

Có nhiều cách để tính độ lệch chuẩn mặc dù. Ví dụ, ngay cả khi loạt phim đứng yên, chúng thường có tự động tương quan. Trong trường hợp này, GARCH là một phương pháp phổ biến, sẽ cung cấp cho bạn phương sai có điều kiện. Vì vậy, bạn có thể xem xét cả phương sai chạy dài và điều kiện. Đôi khi loạt bài thể hiện hành vi phương sai ngẫu nhiên, trong trường hợp này các mô hình như Heston có thể được sử dụng.

Ngay cả với Gaussian đơn giản nhất, giả định độc lập có nhiều cách ước tính phương sai. Hãy xem bài viết này về cách nó được thực hiện trong thiết bị đầu cuối Bloomberg.


Cảm ơn sự giúp đỡ của bạn! Nếu tôi chỉ có thể làm rõ, các biện pháp được cung cấp trong tài liệu đính kèm có áp dụng cho dữ liệu bán hàng không? Nó đã đề cập rằng đây là 'lợi nhuận về giá' (với phương tiện thường gần 0 như bạn đã nêu), vì vậy tôi chỉ tự hỏi làm thế nào nó có thể áp dụng cho dữ liệu bán hàng có thể có nhiều phương tiện khác nhau. Ví dụ: có một công thức nhật ký (lợi nhuận) được chỉ định dựa trên cổ tức và giá đóng cửa. X (i) = log (sales (i) / sales (i-1)) sẽ là sự thay thế hợp lệ? Dữ liệu là hàng tuần nếu nó giúp. Tôi đánh giá cao tất cả những hiểu biết của bạn, đặc biệt là trên các mô hình GRACH.
user181973

Bất cứ điều gì bằng đô la (tiền tệ) đều có tiềm năng là không cố định, cả do lạm phát và tăng trưởng thực sự. Các công ty trong nền kinh tế thị trường liên tục dự kiến ​​sẽ tăng doanh số. Đó là lý do tại sao bạn có thể cần phải đo lường mức độ biến động theo các điều khoản tốc độ tăng trưởng. Nếu bạn đối phó với khoảng thời gian ngắn, điều này thường không phải là mối quan tâm
Aksakal

Dưới đây là một liên kết hữu ích để triển khai GARCH trong python (bài viết từ tháng 8 năm 2018)
ascripter

8

Như đã lưu ý, các phương pháp thống kê điển hình dựa trên các chỉ tiêu L2 bao gồm dev std cũng như hệ số biến thiên (đối với các số liệu không âm, tạo ra một phép đo bất biến tỷ lệ) cũng như chỉ số phân tán (tỷ lệ phương sai với giá trị trung bình). Nếu dữ liệu là tài chính thì cũng có thể tính toán các biện pháp rủi ro "ngược" và / hoặc "nhược điểm", hay còn gọi là độ lệch bán mục tiêu trên hoặc dưới mục tiêu , như được mô tả trong các bài viết wiki này ( https: //en.wikipedia .org / wiki / Downside_risk hoặc https://en.wikipedia.org/wiki/Upside_risk ).

Các biện pháp dựa trên định mức L1 là có thể, ví dụ, MAD hoặc độ lệch tuyệt đối trung bình và MADM, độ lệch tuyệt đối trung vị so với trung vị. Các ước tính không tham số khác bao gồm phạm vi liên mã hóa, phạm vi liên mã hóa, cũng như các số liệu được thảo luận bởi Rousseeuw và Croux trong bài báo của họ, Các lựa chọn thay thế cho Độ lệch tuyệt đối trung bình (bản sao được trích dẫn ở đây ... http://web.ipac.caltech.edu/ nhân viên / fmasci / home / astro numfs / BetterThanMAD.pdf ).

Phương pháp tiếp cận lý thuyết thông tin bao gồm các biện pháp entropy ( https://en.wikipedia.org/wiki/Entropy_(inatures_theory) ), chẳng hạn như U của Theil hoặc nhiều biến thể của chỉ số đa dạng thông tin (ví dụ : https: //en.wikipedia .org / wiki / Generalized_entropy_index ).

Sự tranh cãi của Hyndman là số liệu MASE của anh ta là tối ưu cho dữ liệu chuỗi thời gian. MASE là một chức năng mất bình thường. Sau khi tạo dữ liệu đào tạo và kiểm tra, phần dư dữ liệu kiểm tra được chuẩn hóa hoặc chia cho sai số trung bình trong dữ liệu đào tạo. Nếu MASE <1 thì mô hình đề xuất là một sự cải tiến, trung bình, vượt lên trước một bước, dự báo bước đi ngẫu nhiên.

Xem bài viết của ông, Hyndman và Koehler, Một cái nhìn khác về các biện pháp chính xác dự báo, Tạp chí Dự báo Quốc tế, 22 (4): 679-688, 2006, https://robjhyndman.com/ con / mase.pdf , p. 3

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.