Một trong những vấn đề quan trọng đang được các nhà dự báo phải đối mặt là liệu loạt bài đã cho có thể được dự báo hay không?
Tôi tình cờ đọc được một bài báo có tựa đề " Entropy như một chỉ số dự báo ưu tiên " của Peter Catt sử dụng Entropy Entropy (ApEn) như một thước đo tương đối để xác định chuỗi thời gian nhất định có thể dự báo được.
Bài báo nói rằng,
"Các giá trị ApEn nhỏ hơn cho thấy nhiều khả năng một tập hợp dữ liệu sẽ được theo sau bởi dữ liệu tương tự (tính đều đặn). Ngược lại, giá trị ApEn lớn hơn cho thấy khả năng dữ liệu tương tự được lặp lại (không đều) thấp hơn. , tính ngẫu nhiên và độ phức tạp của hệ thống. "
Và được theo sau bởi các công thức toán học để tính ApEn. Đây là một cách tiếp cận thú vị bởi vì nó cung cấp một giá trị số có thể được sử dụng để đánh giá tính dự báo theo nghĩa tương đối. Tôi không biết Entropy Entropy nghĩa là gì, tôi đang đọc thêm về nó.
Có một gói gọi là pracma trong R
đó cho phép bạn tính toán ApEn. Với mục đích minh họa, tôi đã sử dụng 3 chuỗi thời gian khác nhau và tính các số ApEn.
- Sê-ri 1: Chuỗi thời gian nổi tiếng của AirPasbah - có tính quyết định cao và chúng tôi sẽ có thể dự báo dễ dàng.
- Sê-ri 2: Sê-ri thời gian mặt trời - được xác định rất rõ nhưng nên ít dự báo hơn sê-ri 1.
- Sê-ri 3: Số ngẫu nhiên Không có cách nào để dự báo chuỗi này.
Vì vậy, nếu chúng ta tính ApEn, Series 1 nên nhỏ hơn Series 2 nên rất ít Series 3.
Dưới đây là đoạn R tính toán ApEn cho cả ba chuỗi.
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
Đây không phải là những gì tôi mong đợi. Sê-ri ngẫu nhiên có số lượng thấp hơn sê-ri AirPasbah được xác định rõ. Ngay cả khi tôi tăng số ngẫu nhiên lên 100, tôi vẫn nhận được số sau ít hơn chuỗi 2 / Sunspot.yealry được xác định rõ.
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
Dưới đây là những câu hỏi của tôi:
- Có 2 tham số khi tính ApEn (
m
vàr
)? Làm thế nào để xác định chúng. Tôi đã sử dụng mặc định trongR
mã ở trên. - Những gì tôi đang làm không chính xác đang cho thấy rằng ApEn không chính xác thấp hơn cho các số ngẫu nhiên so với một chuỗi được xác định rõ như sunspot.yearly.
- Tôi có nên giải thích / loại bỏ loạt phim và sau đó ước tính ApEn. Tuy nhiên, tác giả đã áp dụng ApEn trực tiếp vào bộ truyện.
- Có cách nào khác để xác định xem loạt phim có thể dự báo được không?