Từ việc xây dựng câu hỏi, tôi cho rằng không có "ví dụ" nào về sự bất thường (tức là nhãn). Với giả định đó, một cách tiếp cận khả thi sẽ là sử dụng các bộ tự động : mạng thần kinh nhận dữ liệu đầu vào của bạn và được đào tạo để xuất dữ liệu đó. Ý tưởng là việc đào tạo đã cho phép mạng tìm hiểu các biểu diễn của phân phối dữ liệu đầu vào dưới dạng các biến tiềm ẩn.
Có một loại autoencoder gọi denoising autoencoder , được đào tạo với các phiên bản lỗi của dữ liệu gốc như là đầu vào và với uncorrupted dữ liệu gốc như đầu ra. Điều này mang lại một mạng có thể loại bỏ nhiễu (tức là hỏng dữ liệu) khỏi các đầu vào.
Bạn có thể đào tạo một bộ mã hóa tự động khử nhiễu với dữ liệu hàng ngày. Sau đó sử dụng nó trên dữ liệu hàng ngày mới; bằng cách này, bạn có dữ liệu hàng ngày ban đầu và một phiên bản chưa được sửa chữa của những dữ liệu rất giống nhau. Sau đó, bạn có thể so sánh cả hai để phát hiện sự khác biệt đáng kể .
Chìa khóa ở đây là định nghĩa về sự khác biệt đáng kể mà bạn chọn. Bạn có thể tính toán khoảng cách euclide và giả sử rằng nếu nó vượt quá ngưỡng tùy ý nhất định, bạn có sự bất thường. Một yếu tố quan trọng khác là loại tham nhũng mà bạn giới thiệu; họ nên càng gần càng tốt với những bất thường hợp lý.
Một lựa chọn khác là sử dụng Mạng đối thủ tổng hợp . Sản phẩm phụ của khóa đào tạo là một mạng phân biệt đối xử phân biệt dữ liệu hàng ngày bình thường với dữ liệu bất thường.