Những thẻ meta meta nào được gắn thẻ ưu tiên?


8

Vợ tôi làm việc tại một trường trung học ở Đức. Gần đây tôi nhận thấy rằng rất khó để tìm thấy trang chủ của trường đó bằng Google. Tôi đã xem mã nguồn của trang và tôi tin rằng tôi đã tìm thấy lý do: Có hai <meta name="robots">thẻ; một là

<meta name="robots" content="all">

và cái thứ hai, sâu hơn trong trang, là

<meta name="robots" content="noindex, follow">

Tôi đoán là cái thứ hai hơn cái thứ nhất và ngăn Google lập chỉ mục trang web. Tôi có đúng không Tôi sẽ không muốn nói với quản trị trang web rằng tôi đã tìm ra vấn đề và tự biến mình thành kẻ ngốc (vì tôi thực sự không biết gì về cách xây dựng một trang web phù hợp, chứ đừng nói đến SEO).

Nhân tiện, nếu bạn tình cờ tìm thấy bất kỳ sự ngu ngốc nào khác trên trang web, tôi sẽ rất vui nếu bạn có thể báo cáo chúng. Ứng cử viên tiếp theo của tôi sẽ là thiếu các metathẻ có liên quan để truyền tải thông tin về nội dung của trang.


1
Wikipedia tiếng Đức <meta name="robots" content="all"> có nghĩa là bằng nhau về mặt ngữ nghĩa <meta name="robots" content="index, follow">, vì vậy cả hai thẻ meta đều mâu thuẫn theo bất kỳ cách nào. Tôi sẽ thông báo cho quản trị trang web. Tôi cũng đoán rằng Google sẽ chọn chính sách chặt chẽ hơn và do đó không lập chỉ mục trang để ngăn chặn các vấn đề bản quyền.
Matthias Rrid

3
Tôi cũng thấy rằng ở cuối trang, hai yêu cầu được gửi đến máy chủ của bên thứ ba ( ajax.googleapis.comssl.google-analytics.com). Đây có thể là một vấn đề pháp lý làm mất đi đặc quyền của quyền tự quyết thông tin ở Đức. Tôi muốn giới thiệu để tránh điều đó.
Matthias Rrid

1
Ngoài ra còn có hai titleyếu tố. Và điều tương tự được lặp lại trên các trang khác, không chỉ trang chủ! Trên thực tế, dường như không có bất kỳ trang nào được lập chỉ mục, ngoài một số tệp PDF!? Các mô-đun xung đột trong CMS có lẽ?! Một vấn đề phụ ... Như đã nêu trong các câu trả lời, quy tắc hạn chế nhất sẽ được các công cụ tìm kiếm áp dụng - không nhất thiết phải là quy tắc sau. Tuy nhiên, một hàm như PHP get_meta_tags()sẽ chỉ trả về quy tắc sau - vì vậy có một vấn đề (tiềm năng) ngay lập tức với việc có nhiều thẻ meta cho cùng một dữ liệu.
MrWhite

@ w3d: Cảm ơn những hiểu biết! Điều này rất hữu ích.
Tim Pietzcker

Câu trả lời:


6

Mặc dù Wikipedia tiếng Đức tuyên bố đó alllà một giá trị hợp lệ, tôi không biết thông tin đó đến từ đâu và Wikipedia tiếng Đức không trích dẫn bất kỳ nguồn nào. Đó là AFAIK sai và IMHO là một ví dụ điển hình cho lý do tại sao người ta không nên dựa vào Wikipedia cho loại thông tin này.

Nếu bạn muốn sử dụng thẻ meta robot để chỉ đạo googlebot , thông tin tốt nhất về các giá trị hợp lệ là trung tâm quản trị trang web của Google . Nó liệt kê sáu giá trị sau là hợp lệ : noindex, nofollow, noarchive, nosnippet, noodp, none.

Nói cách khác, đối với googlebot :

meta name="robots" content="all">

là một lỗi cú pháp và sẽ bị bỏ qua, trong khi:

<meta name="robots" content="noindex, follow">

là cú pháp hợp lệ và sẽ được tuân theo (vì vậy điều này giải thích tại sao cực kỳ khó tìm trang chủ của trường đó bằng Google).

Để trả lời câu hỏi thứ hai của bạn, điều gì xảy ra nếu hai thẻ meta robot hợp lệ xung đột, Google nói (cùng trang với một liên kết ở trên):

Nếu giá trị nội dung xung đột, chúng tôi sẽ sử dụng hạn chế nhất.

Đối với thẻ meta, đây là tổng quan về thẻ Meta được Google công nhận .


Cảm ơn các liên kết đến trung tâm quản trị web của Google. Tôi sẽ đưa nó cho quản trị trang web của trường.
Tim Pietzcker

2
Các thẻ meta của rô bốt được ghi lại chi tiết trong developers.google.com/webmasters/control-crawl-index/docs/ Kẻ - cách đơn giản để nhớ rằng đó là những cái "tích cực" (tất cả, chỉ mục, theo dõi) không có có tác dụng gì cả.
John Mueller

4

Theo như tôi biết, hành vi của hai thẻ meta xung đột không được xác định, nhưng rất có thể quy tắc hạn chế nhất sẽ giành chiến thắng.

Điều này xảy ra trường hợp tương tự của tệp robots.txt so với thẻ meta robot. Nếu robot.txt ngăn lập chỉ mục một trang và meta-robot thì không, trang đó sẽ không được lập chỉ mục. Và nếu robot.txt cho phép một trang nhưng siêu robot chặn nó, nó sẽ vẫn không được lập chỉ mục.

Vì vậy, logic sẽ ra lệnh rằng nếu có hai thẻ meta xung đột nhau, nếu một khối lập chỉ mục, nó sẽ ghi đè lên cái kia (bất kể vị trí tương ứng của chúng trên trang).

Bạn nên hỏi quản trị trang web nếu họ đang chặn các công cụ tìm kiếm vì một lý do cụ thể. Nếu không, hãy xóa cả hai thẻ meta (mặc định là cho phép các công cụ tìm kiếm để không có lý do nào để có thẻ này cả).

Đối với phần khác của câu hỏi của bạn, đánh giá trang web nằm ngoài phạm vi của Pro Webmaster. Nhưng tôi sẽ thêm rằng thẻ mô tả meta có lẽ là thẻ duy nhất bạn thấy hữu ích. Thẻ từ khóa meta không được sử dụng bởi bất kỳ công cụ tìm kiếm nào.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.