Phân tích hoàng thổ nhằm mục đích làm mịn chuỗi bằng cách áp dụng mức trung bình cho dữ liệu để nó thu gọn thành các thành phần, ví dụ như xu hướng hoặc theo mùa, rất thú vị cho việc phân tích dữ liệu. Nhưng phương pháp này không có ý định làm một bài kiểm tra chính thức cho sự hiện diện của tính thời vụ .
Mặc dù trong ví dụ của bạn stl
trả về một mẫu được làm mịn theo chu kỳ theo mùa, mẫu này không liên quan để giải thích tính năng động của chuỗi. Để thấy điều đó, chúng ta có thể so sánh phương sai của từng thành phần với phương sai của chuỗi ban đầu.
set.seed(123)
x <- ts(rnorm(144, sd=1), frequency=12)
a <- stl(x, s.window="periodic")
apply(a$time.series, 2, var) / var(x)
# seasonal trend remainder
# 0.07080362 0.07487838 0.81647852
Chúng ta có thể thấy rằng đó là phần còn lại giải thích phần lớn phương sai trong dữ liệu (như chúng ta mong đợi cho một quá trình nhiễu trắng).
Nếu chúng ta thực hiện một loạt với tính thời vụ, phương sai tương đối của thành phần theo mùa có liên quan hơn nhiều (mặc dù chúng ta không có cách đơn giản để kiểm tra nó vì hoàng thổ không phải là tham số).
y <- diff(log(AirPassengers))
b <- stl(y, s.window="periodic")
apply(b$time.series, 2, var) / var(y)
# seasonal trend remainder
# 0.875463620 0.001959407 0.117832537
Các phương sai tương đối chỉ ra rằng tính thời vụ là thành phần chính giải thích tính năng động của chuỗi.
Một cái nhìn bất cẩn về cốt truyện từ stl
có thể là lừa dối. Mẫu đẹp được trả về stl
có thể khiến chúng tôi nghĩ rằng mẫu có thể được xác định trong dữ liệu có thể được xác định trong dữ liệu, nhưng nhìn kỹ hơn có thể cho thấy thực tế không phải vậy. Nếu mục đích là để quyết định sự hiện diện của tính thời vụ, phân rã hoàng thổ có thể hữu ích như một cái nhìn sơ bộ nhưng nó cần được bổ sung bằng các công cụ khác.