Tệp robot.txt hợp lệ tối thiểu là gì?


14

Tôi không thích điều đó Tôi thấy rất nhiều lỗi 404 trong access.log của máy chủ web của tôi. Tôi đang gặp phải những lỗi đó vì trình thu thập thông tin cố gắng mở tệp robot.txt , nhưng không thể tìm thấy. Vì vậy, tôi muốn đặt một tệp robot.txt đơn giản sẽ ngăn các lỗi 404 xuất hiện trong tệp nhật ký của tôi.

Tệp robot.txt hợp lệ tối thiểu là gì sẽ cho phép mọi thứ trên trang web được thu thập thông tin?

Câu trả lời:


17

Như được chỉ ra ở đây , hãy tạo một tệp văn bản có tên robot.txt trong thư mục cấp cao nhất của máy chủ web của bạn. Bạn có thể để trống hoặc thêm:

User-agent: *
Disallow:

Nếu bạn muốn robot bò mọi thứ . Nếu không, sau đó xem liên kết ở trên để biết thêm ví dụ.


Tại sao thêm "Không cho phép:" và không chỉ "Cho phép: *"?
Athoxx

2
@Patrik "Cho phép" là để ghi đè mọi chỉ thị "Không cho phép" trước đó. Thật vô nghĩa nếu không có "Không cho phép". Thành thật giải pháp tốt nhất là một tập tin trống.
DisgruntledGoat

2
Ah tôi thấy. Tôi cũng đồng ý rằng một tập tin trống là tốt nhất.
Athoxx

2
@PatrikAlienus Vì "Cho phép" không có trong đặc tả robot.txt.
dùng11153

1
@ user11153: Hả? Điều gì về phần "3.2.2 Các dòng cho phép và không cho phép" của đặc tả Dự thảo Internet 1997 Một phương pháp để kiểm soát robot trên web ?
David Cary

2

Tối thiểu tốt nhất robots.txtlà một tập tin hoàn toàn trống rỗng.

Bất kỳ chỉ thị "null" nào khác như trống rỗng Disallowhoặc Allow: *không chỉ vô dụng vì chúng là không có, mà thêm vào sự phức tạp không cần thiết.

Nếu bạn không muốn tệp hoàn toàn trống - hoặc bạn muốn làm cho nó dễ đọc hơn - chỉ cần thêm một nhận xét bắt đầu bằng #ký tự, chẳng hạn như # blank file allows all. Trình thu thập thông tin bỏ qua các dòng bắt đầu bằng #.


0

Tôi sẽ nói điều này;

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Nó sẽ cho phép Google thu thập dữ liệu mọi thứ nhưng sẽ không cho phép Google thu thập dữ liệu bảng điều khiển aadminn của bạn. Đó là một tình huống lý tưởng cho bạn.


2
Tôi có thể đang thiếu một cái gì đó, nhưng tôi không nghĩ người hỏi nói rằng họ đang sử dụng Wordpress.
Maximillian Laumeister
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.