Các phân tích truyền thống là tốt. Phân tích "truyền thống" là, nếu nó được giải thích chính xác, là một xấp xỉ; dựa trên việc tính toán số lượng ô dự kiến là 0/1 khi bạn băm các khóa vào bộ lọc và sau đó phân tích như thể đó là số thực tế. Vấn đề là số lượng ô là 0 (hoặc 1) tập trung chặt chẽ xung quanh kỳ vọng của chúng, vì vậy đó là một xấp xỉ tốt. Điều này đã được biết đến, và tôi có thể tìm thấy, thậm chí trở lại trong bài viết khảo sát của tôi với Andrei Broder.
Bài viết này nói rằng hiệu suất thực sự của bộ lọc Bloom là một biến ngẫu nhiên (tương ứng với tỷ lệ thực tế của các mục nhập 0/1) và nếu bạn muốn tính chính xác hiệu suất đó vì một số lý do, bạn cần phải thực hiện kết hợp. Đối với các bộ lọc nhỏ hơn, bạn sẽ thấy một sự khác biệt không đáng kể.
Tôi đã nói chuyện với các tác giả của bài viết này. Phân tích của họ là tốt và tốt (mặc dù tôi cho rằng nó không sâu hoặc mới); động lực của họ rằng "phân tích truyền thống là sai", tôi nghĩ, đã phóng đại.