Tôi cần thực hiện phát hiện bất thường trên một số bộ dữ liệu chuỗi thời gian. Tôi chưa bao giờ làm điều này trước đây và hy vọng cho một số lời khuyên. Tôi rất thoải mái với python, vì vậy tôi thích giải pháp được thực hiện trong đó (hầu hết mã của tôi là python cho các phần khác trong công việc của tôi).
Mô tả dữ liệu: Đó là dữ liệu chuỗi thời gian hàng tháng chỉ mới bắt đầu được thu thập trong 2 năm qua hoặc lâu hơn (tức là chỉ khoảng 24-36 khoảng thời gian). Về cơ bản, có một số số liệu được theo dõi hàng tháng cho một số khách hàng.
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
Đây là những gì tôi nghĩ: kéo dữ liệu vào một khung dữ liệu (gấu trúc), sau đó tính trung bình 6 tháng cho mỗi cặp khách hàng / số liệu. Nếu giá trị của khoảng thời gian hiện tại vượt quá một số ngưỡng dựa trên thời gian 6 tháng, sau đó tăng cờ. Vấn đề có vẻ khá đơn giản. Tôi chỉ muốn chắc chắn rằng tôi đang thực hiện một cách tiếp cận vững chắc.
Bất kỳ lời khuyên để xác thịt ý tưởng này một chút sẽ được đánh giá rất cao. Tôi biết câu hỏi hơi trừu tượng và tôi xin lỗi vì điều đó.