Rất nhiều thư rác đang xâm nhập qua bộ lọc trên máy chủ thư mà tôi chạy với thủ thuật tương đối đơn giản là bắt đầu với một vài dòng giảm cân (cực kỳ rõ ràng) hoặc văn bản lừa đảo khác ở trên cùng, tiếp theo là phần văn bản lớn hơn từ tài liệu lập trình - hoặc, ác nhất trong tất cả, văn bản được loại bỏ từ Stack Exchange . Tốt nhất, Spamassassin coi đây là BAYES_50, và thực tế là phần còn lại của các tin nhắn được xây dựng đủ cẩn thận để chúng không bị kích hoạt. (Ví dụ: các tiêu đề là tối thiểu và chính xác.) Thông thường, các đoạn trích được bao gồm đủ chặt chẽ với lợi ích hợp pháp của tôi rằng thông điệp tổng thể được ghi là BAYES_00, bởi vì các mã thông báo rất spam chỉ bị lấn át bởi cách giải quyết vấn đề sysadmin.
Phần trên rõ ràng là spam (và trên thực tế có xu hướng rất giống với các tin nhắn rác đã được nhận và đào tạo trước đó) đến nỗi tôi rất ngạc nhiên rằng nó đã vượt qua - nhưng rõ ràng là như vậy. Có vẻ như một đường chuyền riêng biệt ghi được 25 dòng (hoặc hơn) của tin nhắn và cân nhắc rằng sẽ giải quyết được vấn đề. Có cách nào để làm việc này không?
Một số người đã đề nghị viết biểu thức chính quy tùy chỉnh. Tôi không muốn tham gia vào điều này, vì đây là một trận thua liên tục. Đó là những gì mọi người đã làm trước khi phân loại thư rác Bayes được sử dụng rộng rãi và nói chung là rất khủng khiếp. Không có con người có thể theo kịp . Nó không hiệu quả hơn nhiều so với việc chỉ nhấn phím xóa cho mỗi tin nhắn rác và phần nhiều công việc của tôi.
Lọc thư rác Bayesian hoạt động. Nó thậm chí hoạt động với thư rác này , nếu tôi tách ra phần " phía trên nếp gấp " và chỉ phân tích phần đó, với phần giải mã / chaff bị loại bỏ. Câu hỏi là: làm thế nào tôi có thể khiến Spamassassin làm điều đó?