Làm cách nào để tôi không cho phép toàn bộ thư mục với tệp robots.txt?


19

Tôi có hai trang web tôi hiện đang làm việc đó là một giỏ mua hàng và một người mua sắm khác. Cả hai đều dưới cùng một tên miền, ví dụ như vậy

http://example.com/first_url 
http://example.com/second_url 

Cả hai URL này có hàng tấn trang bên dưới chúng

http://example.com/first_url/product1
http://example.com/first_url/product2 
http://example.com/first_url/product3

http://example.com/second_url/product1
http://example.com/second_url/product2 
http://example.com/second_url/product3

Làm thế nào để không cho phép các URL chính /first_url/second_urlquá và tất cả các trang con và thư mục con? Tôi đã suy nghĩ như thế này nhưng tôi không biết liệu nó có hoạt động hay không và liệu đó có phải là cú pháp đúng không

Disallow: /first_url/*/
Disallow: /second_url/*/

1
Tôi nghĩ cú pháp của bạn là đúng nhưng không chắc chắn về phần bổ sung /

Câu trả lời:


26

Bạn không cần dấu gạch chéo để chặn các thư mục đó. Điều này sẽ làm việc:

Disallow: /first_url/*
Disallow: /second_url/*

Đây trang trợ giúp của Google bao gồm này khá tốt.


7
Bạn chỉ có thể thực hiện "Không cho phép: / first_url". Ký tự đại diện được bỏ qua. Theo nhà phát
triển.google.com/webmasters/control

Bạn cần Disallow: / url / * để khớp với những thứ như example.com/url/test?test=1
Gareth Daine

-1

Bạn có thể sử dụng điều này như mặc định của bạn robots.txt:

User-agent: *
Disallow: first_url/*
Disallow: second_url/*

Ngôi sao sẽ cho phép mọi thứ trong danh mục đó không được phép. Bạn thậm chí có thể không cho phép một điều cụ thể trong danh mục đó bằng cách nhập url cụ thể đó.


4
Điều này không khác gì câu trả lời được chấp nhận ngoài việc bạn đang thiếu dấu gạch chéo bắt đầu. Không cho phép các quy tắc trong tệp robots.txt bắt đầu bằng dấu gạch chéo. Đó là cách tất cả các ví dụ có trong tài liệu
Stephen Ostermiller
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.