Mục tiêu của việc sử dụng danh sách đen DNS không phải là ngăn chặn tất cả thư rác - mục tiêu là phải chặn một tỷ lệ phần trăm tốt của thư rác, nói 1/2 đến có thể bằng 2/3. Bạn chủ yếu làm điều này để giảm tải cho máy chủ của bạn.
Bước tiếp theo, bước loại bỏ thư rác thực sự hiệu quả, là một công cụ lọc bayesian. Xem bài viết gốc của Paul Grahams . Lợi ích chính của lọc Bayes là nó cung cấp một số điểm riêng cho mỗi email, dựa trên lịch sử, sở thích và ngôn ngữ của người nhận trong quá khứ.
Nếu bạn làm theo cách tiếp cận trên, điều quan trọng là phải tránh những sai lầm tích cực trong tuyến phòng thủ đầu tiên. Bạn không thực sự quan tâm để tối đa hóa hiệu quả của bộ lọc thứ nhất, vì có thể bạn sẽ bắt được thư rác còn lại với bộ lọc thứ hai. Nhưng bạn không muốn dương tính giả, vì chúng không thể được hoàn tác sau này.
Vì lý do này, tôi thích danh sách bẫy của Đại học Alberta là bộ lọc đầu tiên của tôi . Nó chỉ chứa các mục có xác suất rất lớn là kẻ gửi thư rác và các mục được xóa nếu chúng không bị spam trong vòng 24 giờ qua.
Danh sách có thể được tải xuống từ đây . Nó được tạo bởi greylning đầu tiên (trì hoãn những người gửi thư lần đầu) và sau đó chuyển sang màu xám (nếu một máy chủ thư đã được ghi lại và nó cố gắng gửi đến một địa chỉ email không được công khai, sau đó greytrap nó).
Sau 24 giờ, một máy chủ sẽ tự động bị xóa khỏi danh sách và được tự do gửi lại email. Do đó, nếu việc spam đã kết thúc (giả sử, một trojan đã được tìm thấy và xóa), thì máy chủ có thể tự do gửi email một lần nữa. Và nếu anh ta vẫn đang spam, thì rất có thể anh ta sẽ lại bị greytrap một lần nữa.
Như đã nói, tôi thích danh sách bẫy của Đại học Alberta rất nhiều, nhưng để hoàn thiện tôi cũng nên đề cập đến Spamhaus DROP . Nó có một cách tiếp cận tối giản hơn so với hầu hết các RBL khác, và cũng sẽ tạo ra một bộ lọc đầu tiên tốt trong thiết lập ở trên.