Tôi có một vectơ và muốn phát hiện các ngoại lệ trong đó.
Hình dưới đây cho thấy sự phân bố của vectơ. Điểm đỏ là ngoại lệ. Điểm màu xanh là điểm bình thường. Điểm vàng cũng bình thường.
Tôi cần một phương pháp phát hiện ngoại lệ (một phương pháp không tham số) có thể chỉ phát hiện các điểm đỏ là ngoại lệ. Tôi đã thử nghiệm một số phương pháp như IQR, độ lệch chuẩn nhưng chúng cũng phát hiện các điểm vàng là ngoại lệ.
Tôi biết thật khó để phát hiện ra điểm đỏ nhưng tôi nghĩ nên có một cách (thậm chí kết hợp các phương pháp) để giải quyết vấn đề này.
Điểm là bài đọc của một cảm biến trong một ngày. Nhưng các giá trị của cảm biến thay đổi do cấu hình lại hệ thống (môi trường không tĩnh). Thời gian của các cấu hình lại là không rõ. Điểm màu xanh là cho giai đoạn trước khi cấu hình lại. Điểm vàng là sau khi cấu hình lại gây ra sự sai lệch trong phân phối các bài đọc (nhưng là bình thường). Điểm đỏ là kết quả của việc sửa đổi bất hợp pháp các điểm vàng. Nói cách khác, chúng là những dị thường cần được phát hiện.
Tôi đang tự hỏi liệu ước tính hàm làm mịn Kernel ('pdf', 'người sống sót', 'cdf', v.v.) có thể giúp ích hay không. Bất cứ ai sẽ giúp về chức năng chính của họ (hoặc các phương pháp làm mịn khác) và biện minh để sử dụng trong bối cảnh để giải quyết vấn đề?