Câu hỏi được gắn thẻ «robots.txt»

Robots.txt là tệp văn bản được sử dụng bởi chủ sở hữu trang web để cung cấp hướng dẫn về trang web của họ cho robot web. Về cơ bản, nó cho robot biết phần nào của trang web đang mở và phần nào được đóng. Đây được gọi là Giao thức loại trừ robot.

4
Tập tin tôi nên có trên mỗi trang web
Tôi muốn có một danh sách các tập tin nên tồn tại trên mỗi trang web. Ý tưởng là làm hài lòng hầu hết các trình duyệt và bot và nhận được số lượng tin nhắn 404 trong nhật ký. Cho đến nay tôi có các tập tin sau: /favicon.ico …






7
Google có bộ đệm robot.txt không?
Tôi đã thêm một tệp robots.txt vào một trong các trang web của tôi một tuần trước, điều này sẽ ngăn Googlebot cố gắng tìm nạp một số URL nhất định. Tuy nhiên, cuối tuần này tôi có thể thấy Googlebot đang tải các URL chính xác đó. Google có …


4
Trang web đã bị hack, cần xóa tất cả các URL bắt đầu bằng + từ Google, sử dụng robot.txt?
Bạn có thể vui lòng cho tôi biết cách chặn các URL như vậy robots.txtđể Googlebots ngừng lập chỉ mục không? http://www.example.com/+rt6s4ayv1e/d112587/ia0g64491218q Trang web của tôi đã bị hack hiện đã được khôi phục nhưng hacker đã lập chỉ mục 5000 URL trong Google và bây giờ tôi gặp lỗi …

3
Tệp robot.txt hợp lệ tối thiểu là gì?
Tôi không thích điều đó Tôi thấy rất nhiều lỗi 404 trong access.log của máy chủ web của tôi. Tôi đang gặp phải những lỗi đó vì trình thu thập thông tin cố gắng mở tệp robot.txt , nhưng không thể tìm thấy. Vì vậy, tôi muốn đặt một tệp …
14 robots.txt 

3
Robots.txt - CSS cho phép hoặc không cho phép
CSS và các mẫu có được phép trong robot.txt không? Nó có nên gây ra vấn đề gì không? Trong Joomla, CSS và các mẫu không được phép trong tệp robots.txt . Vui lòng giúp tôi tìm giải pháp cho việc có hay không đưa robot vào CSS, mẫu, v.v. …
12 css  robots.txt 




2
Công cụ quản trị trang web của Google cho tôi biết rằng robot đang chặn quyền truy cập vào sơ đồ trang web
Đây là robot.txt của tôi : User-agent: * Disallow: /wp-admin/ Disallow: /wp-includes/ Sitemap: http://www.example.org/sitemap.xml.gz Nhưng Google Webmaster Tools cho tôi biết rằng robot đang chặn quyền truy cập vào sơ đồ trang web: Chúng tôi đã gặp lỗi khi cố gắng truy cập Sơ đồ trang web của bạn. Vui …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.