Làm cách nào tôi có thể ngăn thư rác trên các trang web mà tôi kiểm soát?


27

Đây là một câu hỏi wiki chung, cộng đồng để giải quyết tất cả các câu hỏi ngăn chặn thư rác không cụ thể.

Nếu câu hỏi của bạn bị đóng như là một bản sao của câu hỏi này và bạn cảm thấy rằng thông tin được cung cấp ở đây không cung cấp câu trả lời đầy đủ, vui lòng mở một cuộc thảo luận về Pro Webmasters Meta .


Đối với mục đích của câu hỏi này, thư rác sẽ bao gồm:

  • Bất kỳ bài đăng tự động
  • Nội dung được đăng thủ công bao gồm các liên kết đến các trang web của người gửi thư rác
  • Nội dung được đăng thủ công bao gồm các hướng dẫn để truy cập trang web của người gửi thư rác

Câu trả lời:


27

Danh sách sau đây được sắp xếp theo mức độ dễ thực hiện, chi phí bảo trì và hiệu quả trong việc ngăn chặn thư rác:

Vô hiệu hóa tất cả nội dung do người dùng tạo

Đây là một giải pháp thiêu đốt làm mất đi sự phát triển của cộng đồng người dùng xung quanh trang web của bạn, tuy nhiên, nó cũng được đảm bảo giúp bạn tiết kiệm thời gian và công sức xử lý spam hoặc ngăn chặn spam.

Tuy nhiên, việc vô hiệu hóa nội dung do người dùng tạo, không có giải pháp bảo đảm nào ngăn chặn tất cả thư rác (hoặc nội dung không mong muốn khác) xuất hiện, tuy nhiên, một giải pháp ngăn chặn hầu hết những kẻ gửi thư rác là đủ nếu bạn cũng cung cấp cho khách truy cập trang web của mình tùy chọn gắn cờ nội dung như thư rác.

Quản lý nội dung do người dùng tạo bên ngoài

Các dịch vụ như Disqus cho phép quản trị viên web thuê ngoài sàng lọc, lưu trữ và xuất bản các bình luận do người dùng tạo. (Lưu ý: Việc sử dụng dịch vụ của bên thứ ba yêu cầu cấu hình bổ sung để đảm bảo rằng các nhận xét sẽ được lập chỉ mục bởi các công cụ tìm kiếm)

CAPTCHA

Theo Wikipedia , CAPTCHA là viết tắt của "Thử nghiệm Turing công cộng hoàn toàn tự động để phân biệt máy tính và con người". Bất kỳ bài kiểm tra tự động nào được thiết kế để ngăn máy tính đăng nội dung là CAPTCHA: điều này bao gồm buộc người dùng phải đọc các chữ cái, số và từ trong hình ảnh, thực hiện các câu đố từ đơn giản hoặc câu hỏi toán học hoặc nói cách khác là "chứng minh" chúng là người.

Nhược điểm của CAPTCHA là

  1. Hầu hết các dạng CAPTCHA đều cung cấp mức độ khó chịu cho người dùng.

  2. Họ không bảo vệ 100%. Lưu ý rằng nhiều thử nghiệm trong số này có thể được hoàn thành bằng máy tính nếu một lập trình viên có năng lực quyết định đầu tư đủ thời gian và công sức cho vấn đề

Hỏi và đáp

CAPTCHA hiệu quả nhất cho các trang web nhỏ là câu hỏi và trả lời CAPTCHA. Q & A CAPTCHA là một câu hỏi mà một trang web yêu cầu người dùng trả lời. Câu hỏi là một cái gì đó mà bất cứ ai truy cập trang web sẽ biết, nhưng một chương trình máy tính sẽ không biết. Một câu hỏi ví dụ cho một trang web về seo sẽ là "SEO đại diện cho cái gì". Câu hỏi này sẽ dễ dàng cho người đọc trung bình của trang web đó trả lời, nhưng bất kỳ chương trình máy tính nào sẽ không thể làm như vậy.

LƯU Ý: các câu hỏi như "1 + 1" không hoạt động tốt vì chúng thường được sử dụng và những người xây dựng chương trình spam để trả lời chính xác các câu hỏi đó.

Tuy nhiên, nếu trang web của bạn nhận được nhiều lưu lượng truy cập, những kẻ gửi thư rác sẽ lập trình cho robot của họ trả lời các câu hỏi đó một cách tự động và q & a CAPTCHA sẽ không còn gây ảnh hưởng nữa.

Giấu trang

Nếu bạn có một biểu mẫu và bạn không muốn những kẻ gửi thư rác có thể sử dụng nó, một cách tốt để ngăn chặn chúng là sử dụng một trường ẩn. Đây là những cách rất đơn giản để thiết lập: thêm trường dự phòng vào biểu mẫu của bạn, ẩn nó thông qua css (hoặc JavaScript) và dừng mọi thứ cố gắng nhập giá trị vào trường đó. Người dùng bình thường sẽ không thể nhìn thấy trường và sẽ bỏ qua nó, vì nó bị ẩn khỏi chúng, nhưng các chương trình máy tính được sử dụng bởi những kẻ gửi thư rác sẽ cố gắng nhập một giá trị vào trường đó, vì họ không xử lý CSS hoặc javascript. Để đánh bại spam tải CSS hoặc Javascript, bạn có thể thêm một trường bổ sung vào các biểu mẫu với yêu cầu để trống. Bất kỳ khách truy cập nào của con người sẽ để trống và bạn có thể dễ dàng chặn các bot thêm dữ liệu vào trường. Đừng quên thực tế rằng điều này có thể làm cho trang web trông không chuyên nghiệp.

Phân tích lưu lượng và nội dung

Kẻ gửi thư rác có số lượng mạng và máy hạn chế để đăng (mà chúng thường sẽ sử dụng cho đến khi chúng không còn hoạt động nữa). Các giải pháp phân tích lưu lượng thu thập dữ liệu từ một số lượng lớn máy chủ để xác định xem một bài đăng có chứa nội dung spam đã biết hoặc đến từ máy chủ hoặc mạng của người gửi thư rác đã biết hay không.

Có nhiều giải pháp phân tích lưu lượng và CAPTCHA của bên thứ ba miễn phí (hoặc giá rẻ) để sử dụng và hầu hết các phần mềm quản lý nội dung nguồn mở bao gồm các mô-đun tích hợp để sử dụng các dịch vụ như AkismetreCAPTCHA .

Chặn các từ thường có trong thư rác

Nếu bạn nhận thấy rằng thư rác trên trang web của bạn thường chứa những từ không được sử dụng bởi người dùng hợp pháp (chẳng hạn như "liên kết miễn phí đến trang web của bạn"), thì việc chặn người dùng đăng những từ đó là một giải pháp hữu ích. Nếu bạn lo lắng về việc người dùng sử dụng hợp pháp những từ đó trong bài đăng của họ có vấn đề khi đăng trên trang web của bạn, bạn có thể đặt bộ lọc để nó bỏ qua các bài đăng từ người dùng đã thiết lập.

rel="nofollow"

Kẻ gửi thư rác có xu hướng tập trung vào các trang web cho phép họ đăng các liên kết mà công cụ tìm kiếm sẽ theo dõi (do đó cải thiện thứ hạng tìm kiếm của trang web họ đang quảng cáo).

Bạn có thể làm cho trang web của mình bớt hấp dẫn hơn đối với những kẻ gửi thư rác bằng cách thêm rel="nofollow"vào bất kỳ liên kết nào có trong nội dung do người dùng tạo, tuy nhiên, phương pháp này có thể không hoạt động, vì hầu hết các thư rác đều được tự động hóa và những kẻ gửi thư rác không biết cách trang web có sử dụng rel="nofollow"liên kết hay không .

Kiểm duyệt bởi người dùng

Tuy nhiên, nội dung có thể được đăng bởi bất kỳ ai, khi nội dung hiển thị trên trang web, nó cũng có thể bị gắn cờ là spam và bị xóa (Tùy chọn này chỉ hoạt động trong thực tế nếu khách truy cập nhận thấy nội dung spam tương đối hiếm gặp: nếu spam được phép vượt qua các nhận xét hữu ích , hầu hết khách truy cập sẽ không bận tâm đến việc gắn cờ spam).

Gamification

Gamification là một cách tuyệt vời để thúc đẩy người dùng báo cáo thư rác. Cân nhắc thêm tính năng "trọng lượng cờ" vào trang web của bạn: báo cáo càng nhiều người dùng spam, họ càng nhận được nhiều điểm. Điều này sẽ làm cho việc săn lùng thư rác trở nên thú vị hơn và cung cấp cho những người báo cáo quyền khoe thư rác. Điều đó sẽ lần lượt khuyến khích người dùng báo cáo thư rác.

Kiểm duyệt bởi quản trị viên

Một con người phải xem xét mọi mục nội dung được đăng trước khi nó được xuất bản trên trang web - trong khi điều này không ngăn chặn thư rác được đăng, nó sẽ ngăn thư rác hiển thị cho khách truy cập trang web (do đó làm giảm giá trị của trang web đối với người gửi thư rác) .

Đăng ký người dùng

Đăng ký người dùng là một cải tiến so với CAPTCHA vì người dùng chỉ bị buộc phải chứng minh rằng họ là con người một lần trước khi được phép nhận xét một cách thuận tiện - về mặt kỹ thuật đây không phải là một hình thức ngăn chặn spam khác, mặc dù nó giúp loại bỏ spam được tạo bởi người dùng hoặc nhóm người dùng cụ thể (như được xác định bởi tên người dùng, e-mail, địa chỉ IP hoặc yếu tố nhận dạng khác) dễ thực thi hơn.

Người dùng mới vừa phải

Thay vì phê duyệt mỗi bài đăng, quản trị viên có thể xem xét đăng ký người dùng mới để xác định xem có chấp thuận người dùng hay không dựa trên việc đăng ký của người dùng có phù hợp với người gửi thư rác được xác định hoặc spam bots.

Hạn chế khả năng người dùng mới

Kẻ gửi thư rác người sẽ hiếm khi nhớ quay lại tài khoản mà họ đã tạo nếu họ không thể đăng spam tự do trên tài khoản - yêu cầu người dùng mới tạo số lượng bài đăng (nếu cộng đồng có khả năng gắn cờ spam) và / hoặc chờ một bộ lượng thời gian trước khi hạn chế đăng liên kết hoặc nhiều bài viết được dỡ bỏ.

Tính phí người dùng cho thành viên

Nếu bạn tính phí thành viên, ngay cả khi phí nhỏ, những kẻ gửi thư rác sẽ buộc phải cân nhắc chi phí thành viên so với giá trị của việc đăng spam tại trang web của bạn (và vượt qua trang web của bạn để ủng hộ các mục tiêu dễ dàng hơn).

Chỉ mời

Nếu bạn chỉ cho phép những người được người dùng khác mời đăng ký, điều này sẽ cắt giảm đáng kể thư rác (con người thường không mời robot).

Sau đây là từ Dự án BOTCHA , Drupal.

Hũ mật ong

Thực hiện bẫy mật ong . Điểm chính của nó là trường được thêm vào biểu mẫu với một giá trị nhất định, sau đó được sửa đổi bởi JS. Spam là bất kỳ hình thức gửi, giá trị tính toán không giống như chúng ta cần.

Mật ong2

Tương tự như trên, nhưng sử dụng làm nguồn tính toán không phải là giá trị của một trường cụ thể, mà là dữ liệu từ CSS.

ObscureUrl

Tương tự như HoneyPot2: được xây dựng bởi JS được so sánh với nhu cầu. Sự khác biệt là giá trị ban đầu được truyền qua tham số GET.

Phần kết luận

Hầu hết các quản trị web sẽ thấy rằng một hỗn hợp các giải pháp được liệt kê ở trên (ngoại trừ việc không cho phép nội dung do người dùng tạo) hoạt động tốt nhất cho trang web của họ và ít nhất một giải pháp phải được thực hiện để ngăn spam tự động khỏi các cuộc thảo luận của khách truy cập.


1
+1 thông qua phản hồi! Tôi sẽ nói thêm rằng bạn có thể triển khai một số loại hệ thống phần thưởng cho người dùng báo cáo spam là một phần của phương pháp "Kiểm duyệt theo người dùng". Trong ứng dụng tôi đang xây dựng, người dùng báo cáo thành công người gửi thư rác sẽ nhận được "điểm diệt spam" giống như quyền khoe khoang xuất hiện trên hồ sơ của họ. Ngoài ra, họ có thể dành những điểm này như tiền tệ trên trang web để đạt được kết quả niêm yết cao hơn trên các tìm kiếm hồ sơ. Tất nhiên điều này mở ra khả năng lạm dụng, vì vậy tôi phải tìm ra cách nào đó để chống lại hình thức spam đó nếu nó phát sinh.
JakeRow123

@ JakeRow123 Tôi đã thêm một phần về gamification: thoải mái chỉnh sửa nó và thêm suy nghĩ của bạn.

5

Gần đây chúng tôi đã loại bỏ thư rác khỏi biểu mẫu Liên hệ với chúng tôi bằng cách thực hiện rất đơn giản. Chúng tôi đã thêm một đầu vào được gắn nhãn "URL:" ở dạng HTML và làm cho nó trở nên vô hình đối với người dùng thực. Sau đó, trong bộ xử lý biểu mẫu, chúng tôi kiểm tra xem liệu nó có giá trị hay không và hành động tương ứng.

Các spam bots mồi mọi lúc; họ đặt một URL đến một số trang web spam. Kịch bản của chúng tôi thấy điều đó và loại bỏ nhận xét (thực ra, chúng tôi tái chế các bit bởi vì chúng tôi đang cố gắng trở thành một loại công ty thân thiện với môi trường xanh hơn). Trong một thời gian, chúng tôi vẫn lưu trữ nhận xét vi phạm trong bảng cơ sở dữ liệu để xem xét nhưng sẽ từ chối gửi email kết quả ở bất cứ đâu. Đó là cách chúng tôi biết nó hoạt động.

Với phương pháp đơn giản này, chúng tôi đã chuyển từ hơn 30 tin nhắn "Liên hệ với chúng tôi" một ngày tới ZERO.

Chúc may mắn với bất cứ điều gì mà bạn chọn!


Trong đầu vào <form>, chúng tôi bao gồm: <p class = "antispam"> Để trống trường này: <input name = "url" width = "200" /> </ p> Trong tập lệnh xử lý, chúng tôi có: if (isset ($ _ SESSION ['url']) && $ _SESSION ['url'] == '') {mail ($ to, $ topic, $ body, $ headers); }
WebDevKev

1

Tôi có một diễn đàn, nơi tôi tạm thời kích hoạt bài viết ẩn danh. Tôi không muốn sử dụng Captcha, vì bản thân tôi thường gặp khó khăn khi đọc chúng, điều này có thể ngăn mọi người bình luận. Để giúp ngăn chặn thư rác, tôi đã sử dụng Akismet để bắt các tin nhắn không liên quan. Akismet không chống đạn, nhưng nó đã giúp cuộc sống của tôi dễ dàng hơn rất nhiều.

Tuy nhiên, bạn phải nhận thức được dương tính giả. Vì vậy, những gì tôi đã làm là tạo ra một "Thuộc tính thư rác" trên đối tượng bài đăng của mình và đặt nó thành giá trị trả về của Akismet. Nếu một bài đăng sẽ bị đánh dấu là thư rác, tôi sẽ tự gửi email và gửi email, sau đó tôi có thể quyết định xem đó có phải là thư rác hay không.


3
Đây là một câu hỏi và câu trả lời wiki cộng đồng bắt kịp - trọng tâm chính của thông tin chung về phòng chống thư rác để sử dụng trong việc đóng các câu hỏi trùng lặp. Bạn có thể hợp nhất các đề xuất của bạn vào danh sách nếu bạn muốn.
danlefree

+1 akismet dường như làm một công việc khá tốt, không lấy được tất cả và đôi khi chặn các bình luận hợp pháp nhưng 99% thời gian là đúng
sam

0

Vui lòng truy cập MediaWiki.
Tìm kiếm tiện ích mở rộng: Kiểm duyệt
Tiện ích mở rộng này sẽ giúp bạn ngăn chặn thư rác trên các trang web mà bạn kiểm soát.
Tôi đã sử dụng phần mở rộng MediaWiki này nhiều lần.
Và nó ngăn chặn bot tạo ra các bài viết spam.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.