Làm thế nào để spam hoạt động?

43

Tôi có một diễn đàn đang bị tấn công rất nhiều bởi diễn đàn spam, và dĩ nhiên cách tốt nhất để đánh bại thứ gì đó là biết kẻ thù của bạn. Tôi sẽ lo lắng về việc đánh bại những spam bots sau đó, nhưng ngay bây giờ tôi muốn biết thêm về chúng. Đọc xung quanh, tôi cảm thấy ngạc nhiên về việc thiếu thông tin kỹ lưỡng về chủ đề này (hoặc có lẽ sự thiếu hiểu biết của tôi để nhập các cụm từ tìm kiếm chính xác để có kết quả google tốt hơn).

Tôi thích tìm hiểu tất cả về spam bots. Tôi đã hỏi trên các diễn đàn khác và nhận được câu trả lời rõ ràng như "Spamb luôn là người dùng đăng ký trên trang web của bạn."

Làm thế nào để diễn đàn spam hoạt động?
Làm thế nào để họ tìm thấy trang 'đăng ký người dùng mới'? (Tôi đặc biệt ngạc nhiên vì một số diễn đàn không có URL dành riêng cho điều này, ví dụ: www.forum.com/register.html, nhưng thay vào đó sử dụng chuỗi truy vấn hoặc thậm chí các phương thức khác vô hình với thanh URL)
Làm thế nào để họ biết phải nhập gì vào từng trường 'đăng ký người dùng mới'?
Làm thế nào để họ xác định những gì một trang họ có thể spam / nhập dữ liệu vào và những gì không?
Họ thậm chí còn 'xem' trang này chứ?
.. Nếu không, thì tôi cho rằng họ đang liên lạc trực tiếp với máy chủ - làm thế nào - điều này có thể? Họ làm nó như thế nào?
Diễn đàn spam có thể phá CAPTCHA? Họ có thể giải quyết các câu hỏi logic (làm thế nào?)? Câu hỏi toán học?
Họ có kỹ sư đảo ngược các kịch bản xác thực chống bot phía khách hàng không? Kịch bản phía máy chủ?
Những kỹ thuật vẫn còn hiệu lực để ngăn chặn chúng?
Nơi mà spam bots đến từ đâu? Có ai đó ngồi sau máy tính cười khúc khích khi họ xem bot phá hủy trang web của họ sau trang web? Hay họ đang cười khẩy khi họ chỉ đơn giản là 'phát hành' nó lên internet bằng cách nào đó? Là spam 'chạy' bởi một máy tính bị nhiễm ở đâu đó? Họ có tự sao chép không?
Vân vân

spam botattack

— rlb.usa
nguồn

48

Làm thế nào để họ tìm thấy trang 'đăng ký người dùng mới'? (Tôi đặc biệt ngạc nhiên vì một số diễn đàn không có URL dành riêng cho điều này, ví dụ: www.forum.com/register.html, nhưng thay vào đó sử dụng chuỗi truy vấn hoặc thậm chí các phương thức khác vô hình với thanh URL)

Họ tìm thấy các trang web mới bằng cách:

Thu thập dữ liệu và tìm kiếm chữ ký của phần mềm được biết đến. Thông thường đây là một đoạn văn bản như bản quyền hoặc thẻ meta nhưng nó có thể là bất kỳ định danh nhất quán nào. Điều này thường áp dụng cho blog và phần mềm diễn đàn.
Hướng dẫn sử dụng. Con người, có sức lao động rẻ ở nhiều nơi trên thế giới, tìm kiếm các phần mềm hoặc hình thức đã biết có thể dễ dàng khai thác và thêm chúng vào cơ sở dữ liệu. Điều này thường áp dụng cho đăng ký tùy chỉnh và các hình thức liên lạc.
Họ mua danh sách. Giống như địa chỉ email được bán bởi những kẻ gửi thư rác, danh sách trang web mục tiêu dễ bị tổn thương hoặc ưa thích cũng được bán.

Làm thế nào để họ biết phải nhập gì vào từng trường 'đăng ký người dùng mới'?

Họ biết những gì cần nhập vào từng trường bằng cách sử dụng tên trường làm hướng dẫn. 99,99% thời gian trường địa chỉ email được đặt tên là "email" hoặc một cái gì đó có chứa từ "email". Bạn không cần phải là một nhà khoa học tên lửa để biết rằng lĩnh vực đó có thể là cho một địa chỉ email. Đối với những thứ như tên, ID đăng nhập, địa chỉ, vv nó hoạt động theo cùng một nguyên tắc.

Làm thế nào để họ xác định những gì một trang họ có thể spam / nhập dữ liệu vào và những gì không?

Họ không quan tâm. Các công cụ tự động có thể thử rất nhiều hình thức trong một khoảng thời gian ngắn như vậy mà hầu như không mất phí, vì vậy việc thử mọi hình thức có thể là điều không có gì phải làm. Khi lao động của con người tham gia, họ có thể là "những đứa trẻ kịch bản" và thử những thứ rõ ràng để xem liệu họ có nhận được bất kỳ loại phản hồi nào cho thấy biểu mẫu có khả năng bị tổn thương hay không. Về cơ bản, bất kỳ hình thức nào cũng là mục tiêu tiềm năng đối với họ cũng như bất kỳ trang nào chấp nhận đầu vào của người dùng.

Làm thế nào để diễn đàn spam hoạt động?

Họ thậm chí còn 'xem' trang này chứ? .. Nếu không, thì tôi cho rằng họ đang liên lạc trực tiếp với máy chủ - làm thế nào - điều này có thể? Họ làm nó như thế nào?

Nơi mà spam bots đến từ đâu? Có ai đó ngồi sau máy tính cười khúc khích khi họ xem bot phá hủy trang web của họ sau trang web? Hay họ đang cười khẩy khi họ chỉ đơn giản là 'phát hành' nó lên internet bằng cách nào đó? Là spam 'chạy' bởi một máy tính bị nhiễm ở đâu đó? Họ có tự sao chép không?

Tất cả đều tự động. Các công cụ như xrumer được xây dựng và bán và chứa khả năng khai thác phần mềm với các lỗ hổng đã biết. Bất cứ ai cũng có thể mua nó và sau khi thiết lập nó, nó ít nhiều bị cháy và quên đi. Nó đi đến mọi diễn đàn trong danh sách của mình và cố gắng spam nó hết khả năng của nó. Chỉ cần nhờ vào sức mạnh vũ phu, nó thành công và đáng giá cho những kẻ gửi thư rác. Đó là lý do tại sao họ không bao giờ dừng lại. Họ hầu như không phải nhấc một ngón tay cho nó hoạt động.

Diễn đàn spam có thể phá CAPTCHA? Họ có thể giải quyết các câu hỏi logic (làm thế nào?)? Câu hỏi toán học?

Có, nhưng không phải lúc nào cũng vậy. Phụ thuộc vào cách nó được thực hiện tốt. Nhưng nhiều captcha, bao gồm cả những sản phẩm được cung cấp bởi các công ty lớn, đã bị đánh bại và thực sự vô dụng. Đó là lý do tại sao nhiều hình thức bảo vệ được yêu cầu để ngăn chặn chúng. Thậm chí sau đó, con người thường có thể đánh bại bất kỳ hệ thống nào.

Những kỹ thuật vẫn còn hiệu lực để ngăn chặn chúng?

Từ một câu trả lời trước : Bạn có thể làm một số điều (và nên làm nhiều hơn một) bao gồm:

1) Đặt một trường giả mà chỉ bot sẽ nhìn thấy. Sau đó, nếu trường đó được gửi cùng với phần còn lại của biểu mẫu, bạn có thể bỏ qua nó (và cấm chúng nếu muốn). Bạn cũng có thể bẫy các bot xấu theo một liên kết ẩn .

2) Sử dụng một CAPATCHA như reCAPTCHA

3) Sử dụng một trường yêu cầu người dùng trả lời một câu hỏi như 5 + 3. Bất kỳ con người nào cũng có thể trả lời nhưng bot sẽ không biết phải làm gì vì đó là các trường tự động điền vào tên trường. Vì vậy, trường đó sẽ không chính xác hoặc bị thiếu trong trường hợp đệ trình sẽ bị từ chối.

4) Sử dụng mã thông báo và đặt nó vào một phiên và cũng thêm nó vào biểu mẫu. Nếu mã thông báo không được gửi cùng với biểu mẫu hoặc không khớp thì nó sẽ tự động và có thể bị bỏ qua.

5) Tìm kiếm đệ trình lặp đi lặp lại từ cùng một địa chỉ IP. Nếu biểu mẫu của bạn không nhận được quá nhiều yêu cầu nhưng đột nhiên có thể nó đang bị bot tấn công và bạn nên xem xét tạm thời chặn địa chỉ IP.

6) Sử dụng Akismet . Nó là tuyệt vời trong việc xác định thư rác.

— John Conde
nguồn

5

+1 cho câu trả lời thấu đáo. Tôi gặp vấn đề về thư rác và đã triển khai phần tử biểu mẫu ẩn và gọi đó là "email" / "mail" và địa chỉ email thực mà tôi đặt tên là "địa chỉ". Không còn thư rác!

— mar10

1

Một bài viết hay về cách đối phó với các quỷ lùn (ý tưởng này giống với spam bots): mã hóa kinh dị.com / blog / 2011/06 / suspension-ban-or-ellban.html .

— ercpe

Đối với captcha, nó phụ thuộc vào công cụ họ đang sử dụng để đánh bại họ. Có những chương trình phần mềm đôi khi (và không phải luôn luôn) được thông qua captcha, và sau đó có những dịch vụ sử dụng lao động giá rẻ để giải quyết captcha và những dịch vụ này có tỷ lệ thành công cao hơn.

— ub3rst4r

11

Làm thế nào để diễn đàn spam hoạt động?

Các lập trình viên tài năng (nếu xấu xa) viết chúng - có thể có nhiều loại spam khác nhau như có người viết chúng, nhưng thật không may, chỉ cần một vài tác giả spambot chia sẻ và bán tác phẩm của họ để hủy hoại cuộc sống cho các quản trị viên ...

Một ứng dụng spam diễn đàn phổ biến được gọi là "xrumer".

Mặc dù tôi nhận ra rằng điều này không trả lời tất cả các câu hỏi của bạn, tôi nghĩ rằng nó đề cập đến bất cứ điều gì bot không thể làm tốt (như giải quyết các câu hỏi logic không tĩnh phức tạp) có thể được thực hiện bởi một công nhân được trả lương thấp ở nước ngoài. Gửi thư rác là một công việc giống như bất kỳ doanh nghiệp nào khác và không thiếu lao động giá rẻ đang cố gắng đưa tin nhắn rác ra khỏi đó.

— danlefree
nguồn

4

Tôi cảm thấy như tôi vừa xem một con bò đang được chế biến trong một nhà máy thịt. Nhưng thông tin cao.

— rlb.usa

Video thú vị, hài hước rằng nó đã được thực hiện vào đêm Giáng sinh; ngày là 12-25-2006 12:15 sáng ... :-)

— sai lầm

Hành động! rõ ràng là không tài năng ... Chương trình đó làm tôi nhớ đến FriendBlaster (chúng tôi thường sử dụng nó trong công việc - tôi đã chống lại nó, nhưng ông chủ sẽ không lắng nghe). Tôi không nghi ngờ lượng thời gian và công sức mà tác giả dành cho chương trình. Nhưng, thành thật mà nói, không có gì đang được thực hiện là khó thực hiện (và được thực hiện kém trong trường hợp FriendBlaster). Ấn tượng hơn nhiều là các tin tặc và các nhà nghiên cứu bảo mật, những người phát triển khai thác và phá vỡ các kế hoạch DRM trong vài tuần sau khi phát hành.

— Lèse majesté

2

Tôi đã tạo plugin Chống thư rác cho WordPress , nó chặn spam khá tốt mà không cần Captcha hay bất cứ thứ gì khác.

Làm thế nào nó hoạt động: Hai trường thêm được thêm vào mẫu ý kiến. Đầu tiên là câu hỏi về năm hiện tại. Thứ hai nên trống rỗng. Nếu người dùng truy cập trang web, hơn trường đầu tiên được trả lời tự động bằng javascript, trường thứ hai để trống và cả hai trường đều bị ẩn và ẩn cho người dùng. Nếu người gửi thư rác cố gắng gửi mẫu nhận xét, anh ta sẽ mắc lỗi với câu trả lời trên trường đầu tiên hoặc cố gắng gửi trường trống và nhận xét spam sẽ bị từ chối. Người dùng không phải nhập Captcha hoặc bất cứ điều gì khác để chứng minh đó không phải là bot, mọi thứ đều được tạo bởi javascript.

Bạn có thể tải xuống plugin và sử dụng mã để giải quyết vấn đề với thư rác trên trang web của mình.

— webvitaly
nguồn

1

Vì vậy, người dùng của bạn cần javascript để có thể đăng ký? Đó là một sự mất khả năng tiếp cận, phải không?

— Augustin Riedinger

@AugustinRiedinger Plugin chống spam với javascript bị vô hiệu hóa hoạt động như phương pháp captha đơn giản. Có khoảng dưới 2% người dùng bị tắt javascript.

— webvitaly

Bạn có nghĩa là bạn sẽ hiển thị captcha trong trường hợp đó, phải không? Tôi biết nó có rất ít người dùng ở đó, nhưng tôi đã suy nghĩ về mặt thực hành tốt nhất. Đọc những điều thú vị về nó mặc dù.

— Augustin Riedinger

@AugustinRiedinger Có, tôi hiển thị câu hỏi giống như captcha về năm hiện tại nếu người dùng đã tắt javascript.

— webvitaly

0

Khi cố gắng đánh bại họ, một điều tôi nhớ là mục đích của họ thường là đăng các liên kết đến càng nhiều trang web càng tốt vì lợi ích SEO mũ đen.

Họ quan tâm đến số lượng trang web họ có quyền truy cập và không phải trang web của bạn cụ thể. Ai đó chỉ muốn spam một mình trang web của bạn có thể chỉ cần đăng ký mà không cần sử dụng robot.

Như vậy, tôi khá chắc chắn rằng một bài kiểm tra bespoke được viết tốt (ví dụ: các câu hỏi mà các thành viên diễn đàn của bạn sẽ biết câu trả lời) hầu như sẽ có hiệu quả hơn đối với robot so với bất kỳ bài viết nào được viết sẵn mà robot có thể là khôn ngoan đến.

Ví dụ: nếu robot bẻ khóa Recaptcha thì nó sẽ có quyền truy cập vào hàng triệu biểu mẫu để spam. Nếu nó bẻ khóa một bài kiểm tra bespoke, thì nó sẽ chỉ có quyền truy cập vào một trang web, vì vậy không có bot-spam tự động sẽ bận tâm làm điều đó.

https://www.projecthoneypot.org có thể cung cấp một số dữ liệu tốt để sử dụng (ví dụ: từ khóa và ips để chặn)

— Richard B
nguồn