Tôi đang cố gắng phát hiện các giá trị dị thường trong một chuỗi thời gian của dữ liệu khí hậu với một số quan sát bị thiếu. Tìm kiếm trên web tôi tìm thấy nhiều cách tiếp cận có sẵn. Trong số đó, phân tách stl có vẻ hấp dẫn, trong ý nghĩa loại bỏ xu hướng và các thành phần theo mùa và nghiên cứu phần còn lại. Đọc STL: Quy trình phân rã theo xu hướng theo mùa dựa trên Loess , stl
dường như linh hoạt trong việc xác định cài đặt để gán biến thiên, không bị ảnh hưởng bởi các ngoại lệ và có thể áp dụng mặc dù thiếu các giá trị. Tuy nhiên, cố gắng áp dụng nó R
, với bốn năm quan sát và xác định tất cả các tham số theo http://stat.ethz.ch/R-manual/R-patched/l Library / stat / html / stl.html , tôi gặp phải lỗi:
"time series contains internal NAs"
(khi na.action=na.omit
) và
"series is not periodic or has less than two periods"
(khi na.action=na.exclude
).
Tôi đã kiểm tra lại rằng tần số được xác định chính xác. Tôi đã thấy các câu hỏi có liên quan trong blog, nhưng không tìm thấy bất kỳ đề xuất nào có thể giải quyết điều này. Có phải là không thể áp dụng stl
trong một loạt với các giá trị bị thiếu? Tôi rất miễn cưỡng khi nội suy chúng, vì tôi không muốn giới thiệu (và do đó phát hiện ...) các tạo tác. Vì lý do tương tự, tôi không biết nên sử dụng các phương pháp ARIMA như thế nào (và nếu thiếu giá trị vẫn sẽ là một vấn đề).
Vui lòng chia sẻ nếu bạn biết một cách để áp dụng stl
trong một chuỗi với các giá trị bị thiếu hoặc nếu bạn tin rằng các lựa chọn của tôi không có phương pháp, hoặc nếu bạn có bất kỳ đề xuất nào tốt hơn. Tôi còn khá mới trong lĩnh vực này và bị choáng ngợp bởi hàng đống thông tin liên quan (dường như ...).