Trong vương quốc của các bot bình thường, tất cả phụ thuộc vào những gì bạn đánh giá cao và chỉ bạn mới có thể quyết định điều đó. Tất nhiên là có Google, Bing / MSN / Yahoo!, Yahoo và Yandex. Đây là những công cụ tìm kiếm chính. Ngoài ra còn có các trang web SEO và backlink khác nhau. Đúng hay sai, tôi cho phép một vài trong số những người lớn có quyền truy cập vào trang web của tôi, nhưng nói chung, họ là những trang web vô dụng. Tôi chặn archive.org không chỉ trong tệp robots.txt, mà bằng tên miền và địa chỉ IP. Điều này là do họ bỏ qua robot.txt thời gian lớn! Đây là một cái gì đó mà bạn cần để có được một cảm giác. Đừng để bị lừa bởi tên đại lý. Thường thì họ bị giả mạo bởi những người xấu. Ngày nay, tôi nhận được hàng ngàn yêu cầu trang từ các nguồn tự xưng là Baidu, nhưng không được. Nhận biết những con nhện này bằng tên miền và khối địa chỉ IP và học cách đối phó với chúng ở cấp độ đó. Những người tốt tuân theo robot.txt.
Nhưng tôi phải cảnh báo bạn, có một TẤN bot lén lút, bot lừa đảo, người dọn dẹp, v.v. bạn sẽ muốn tìm kiếm phân tích nhật ký của mình thường xuyên và chặn. 5uck5 này! Nhưng nó phải được thực hiện. Mối đe dọa lớn nhất từ họ những ngày này là các liên kết chất lượng thấp đến trang web của bạn. Mã bảo mật chống bot cập nhật của tôi được triển khai trong năm nay đã tự động giảm 7700 liên kết chất lượng thấp. Tất nhiên, mã của tôi vẫn cần làm việc, nhưng bạn có được điểm. Các bot xấu vẫn đánh cắp tiềm năng trang web.
Sẽ không lâu nữa trước khi bạn hiểu rõ về nó.