Trang web của tôi đang được các webspiders của Google thực hiện. Google được hoan nghênh lập chỉ mục trang web của tôi, nhưng đôi khi nó đang truy vấn một tagcloud trên trang web của tôi nhanh hơn máy chủ web của tôi có thể tạo ra kết quả, khiến máy chủ web của tôi hết tài nguyên.
Làm cách nào tôi có thể giới hạn quyền truy cập vào máy chủ web của mình theo cách mà khách truy cập bình thường không bị ảnh hưởng?
robot.txt không có tùy chọn vì nó sẽ chặn toàn bộ trang web khỏi bị lập chỉ mục.
iptables -m recent
là khó khăn, bởi vì một số trang có rất nhiều hình ảnh hoặc tệp dữ liệu khác và các kích hoạt 'gần đây' trên những trang đó (thường là trình tổng hợp RSS của tôi, tải hình ảnh và nguồn cấp dữ liệu).
iptables -m limit
có cùng nhược điểm và trên hết, tôi không thể chọn lọc theo từng địa chỉ nguồn IP.
Làm cách nào tôi có thể giới hạn khách truy cập khiến tải máy chủ của tôi tăng quá cao?
Tôi đang chạy apache2 trên máy chủ Ubuntu trong VirtualBox VM.