Nếu tôi không muốn thiết lập bất kỳ hành vi đặc biệt nào, liệu tôi có phiền khi có tệp robot.txt không?
Hoặc thiếu một trong những có thể có hại?
Nếu tôi không muốn thiết lập bất kỳ hành vi đặc biệt nào, liệu tôi có phiền khi có tệp robot.txt không?
Hoặc thiếu một trong những có thể có hại?
Câu trả lời:
Thiếu tệp robots.txt sẽ không gây hại. Từ trang web robotstxt.org :
Để cho phép tất cả các robot truy cập hoàn toàn
Tác nhân người dùng: *
Không cho phép:(hoặc chỉ tạo một tệp "/robots.txt" trống hoặc không sử dụng một tệp nào cả)
Tuy nhiên, ngay cả khi bạn không chỉ định bất cứ điều gì trong tệp robot.txt của mình, đó là một cách tốt để thông báo cho các công cụ tìm kiếm về vị trí của Sơ đồ trang web XML của bạn . Bạn có thể làm điều này bằng cách thêm một dòng ở đầu tệp robot.txt của bạn trông giống như:
Sơ đồ trang web: http://www.example.com/sitemap-host1.xml
Bạn cũng nên lưu ý rằng việc không có nó sẽ tạo ra rất nhiều mục 404 trong nhật ký web của bạn.
Nếu bạn không có "robot.txt", nhật ký lỗi của bạn sẽ nhận được rất nhiều 404 trên tệp, đây có thể là một loại phiền toái, tương tự như nếu bạn không có favicon.
robots.txt
tệp đơn giản , ngoài ra sẽ được tải xuống ít thường xuyên hơn do các công cụ tìm kiếm áp dụng kiểm soát bộ đệm HTTP thích hợp .
Tôi nghĩ rằng nó sẽ có được OK, nếu không những dải khổng lồ web sẽ là un-lập chỉ mục bởi nhện web.
Không robots.txt
giống như một "cho phép lập chỉ mục bởi mọi người" robots.txt
gần như theo định nghĩa.
Chà, vì robots.txt
chứa địa chỉ của sơ đồ trang web của bạn , không có địa chỉ nào có khả năng gây hại.