Vì bạn chỉ cho phép các công cụ tìm kiếm chỉ một tên miền, RewriteRules của bạn có thể được làm đơn giản hơn. Chỉ cần sử dụng này:
RewriteEngine On
RewriteCond %{HTTP_HOST} ^example3\.com$
RewriteRule ^robots\.txt$ /robots-allow.txt [L]
Trong thư mục public_html, bạn cần tạo hai tệp. robot.txt và robot-allow.txt
Trong robot.txt, bạn cần thêm vào như sau:
User-agent: searchengine
Disallow: /
thay thế searchengine bằng google hoặc bất kỳ công cụ nào bạn muốn chặn. Lặp lại các dòng trên nếu bạn muốn thêm nhiều công cụ tìm kiếm. Sau đó, tệp robots.txt của bạn sẽ trở thành một thứ như thế này:
User-agent: searchengine
Disallow: /
User-agent: searchengine2
Disallow: /
User-agent: searchengine3
Disallow: /
Sau đó, trong robot-allow.txt, bạn có thể để nó dưới dạng một tệp trống hoặc điều chỉnh độ trễ thu thập dữ liệu cho tất cả các công cụ tìm kiếm như thế này:
User-agent: *
Crawl-delay: 1
Số sau độ trễ thu thập dữ liệu biểu thị thời gian chờ tối thiểu tính bằng giây giữa các yêu cầu đến máy chủ từ cùng một tác nhân người dùng.
public_html
?