Vì vậy, các bộ lọc Bloom khá tuyệt - chúng là các bộ hỗ trợ kiểm tra tư cách thành viên không có âm tính giả, nhưng rất ít khả năng là dương tính giả. Gần đây, tôi đã muốn có một "bộ lọc Bloom" đảm bảo điều ngược lại: không có dương tính giả, nhưng có khả năng phủ định sai.
Động lực của tôi rất đơn giản: được cung cấp một luồng lớn các mặt hàng để xử lý (với các bản sao), chúng tôi muốn tránh xử lý các mặt hàng mà chúng tôi đã thấy trước đây. Sẽ không hại gì khi xử lý một bản sao, nó chỉ là một sự lãng phí thời gian. Tuy nhiên, nếu chúng ta bỏ qua việc xử lý một yếu tố, nó sẽ là thảm họa. Với "bộ lọc Bloom đảo ngược", người ta có thể lưu trữ các mục được nhìn thấy với ít không gian và tránh xử lý các bản sao có xác suất cao bằng cách kiểm tra tư cách thành viên trong tập hợp.
Tuy nhiên, tôi dường như không thể tìm thấy bất cứ điều gì của loại. Gần nhất tôi đã tìm thấy là " bộ lọc Bloom được chỉnh sửa lại ", cho phép một bộ lọc trao đổi dương tính giả được chọn với tỷ lệ âm tính giả cao hơn. Tuy nhiên, tôi không biết cấu trúc dữ liệu của họ hoạt động tốt như thế nào khi một người muốn loại bỏ tất cả các kết quả dương tính giả.
Bất cứ ai cũng nhìn thấy bất cứ điều gì như thế này? :)