Các trang của Canonical trên tên miền phụ hiển thị trong kết quả tìm kiếm của Google


8

Bạn có thể đã nghe nói rằng chúng tôi đã khởi chạy Facebook Stack Overflow ngày hôm qua.

Là một phần của việc này, chúng tôi đã sửa đổi mã của mình để đặt <meta rel="canonical" ...các thẻ cho mọi câu hỏi và người dùng trên tên miền facebook.stackoverflow.com trỏ đến "Tràn" Stack Overflow.

Ví dụ:

Lỗi iAd "Khoảng không quảng cáo quảng cáo" trên facebook.stackoverflow.com
&
iAd lỗi "Khoảng không quảng cáo quảng cáo" trên stackoverflow.com

Trên facebook.stackoverflow html chứa thẻ meta

<link rel="canonical" href="/programming/3720459/iad-error-ad-inventory-unavailable">

Mục đích là để nói với Google "đây chính xác là cùng một trang, truyền tất cả thứ hạng trang vào bản sao của Stack Overflow và thích nó trong kết quả tìm kiếm".

Điều này có vẻ như điểm của rel = "canonical" .

Một trang chính là phiên bản ưa thích của một tập hợp các trang có nội dung rất giống nhau.

Một trang web thường có một vài trang liệt kê cùng một bộ sản phẩm. Ví dụ: một trang có thể hiển thị các sản phẩm được sắp xếp theo thứ tự bảng chữ cái, trong khi các trang khác hiển thị cùng các sản phẩm được liệt kê theo giá hoặc theo xếp hạng. Ví dụ:

Nếu Google biết rằng các trang này có cùng nội dung, chúng tôi chỉ có thể lập chỉ mục một phiên bản cho kết quả tìm kiếm của chúng tôi. Các thuật toán của chúng tôi chọn trang mà chúng tôi nghĩ là câu trả lời tốt nhất cho truy vấn của người dùng. Tuy nhiên, giờ đây, người dùng có thể chỉ định một trang chính tắc cho các công cụ tìm kiếm bằng cách thêm một phần tử có thuộc tính rel = "canonical" vào phần của phiên bản không chính tắc của trang. Thêm liên kết và thuộc tính này cho phép chủ sở hữu trang web xác định các bộ nội dung giống hệt nhau và đề xuất với Google: "Trong tất cả các trang có nội dung giống hệt nhau, trang này là hữu ích nhất. Vui lòng ưu tiên nó trong kết quả tìm kiếm."

Tuy nhiên, chúng tôi đang thấy kết quả Facebook Stack Overflow và đôi khi họ thậm chí còn vượt qua cả vanilla Stack Overflow ( một ví dụ ). Có lẽ đây là một cái gì đó để làm với một sitemap.xml độc lập cho facebook.stackoverflow.com (loại ảnh chụp trong bóng tối)?

ví dụ kết quả tìm kiếm Google

Vậy, chúng ta đang làm gì sai ở đây?

Chúng tôi hy vọng sẽ giữ cho các tìm kiếm của biểu mẫu hoạt site:facebook.stackoverflow.comđộng, nhưng việc từ bỏ chúng là hoàn toàn chấp nhận được nếu cần tổng cộng rel="noindex".

Câu trả lời:


4

Theo cùng một trang bạn liên kết đến rel="canonical" chỉ là một gợi ý và không phải là một chỉ thị:

Rel = "canonical" là một gợi ý hay một chỉ thị?

Tùy chọn mới này cho phép chủ sở hữu trang web đề xuất phiên bản của trang mà Google nên coi là hợp quy. Google sẽ tính đến điều này, kết hợp với các tín hiệu khác, khi xác định bộ URL nào chứa nội dung giống hệt nhau và tính toán mức độ phù hợp nhất của các trang này để hiển thị trong kết quả tìm kiếm.

Có thể Google chỉ đơn giản là đã chọn bỏ qua URL chính tắc hoặc chưa hành động.

Nhưng lý do tại sao nó vượt xa câu hỏi StackOverflow có lẽ đơn giản: (giả sử rằng Google đang bỏ qua rel="canonical"chỉ thị), tên miền phụ của Facebook có "facebook" trong URL mang khá nhiều trọng lượng trong thuật toán xếp hạng của Google.


Chúng tôi đã hy vọng canonicalsẽ bù đắp cho điều đó ... Tôi đoán là không. Vấn đề liên quan đến kết quả FB.SO hiển thị trên một trang ngay cả khi không có cụm từ tìm kiếm trên facebook ( ví dụ ) có vẻ như Google chỉ đang bỏ qua đề xuất.
Kevin Montrose

1
Google dường như làm việc với SO về vấn đề nội dung trùng lặp trong đó các trang web khác vượt trội so với SO cho nội dung gốc của SO. Tôi tự hỏi nếu họ cũng sẽ xem xét điều này cho SO?
John Conde

3

Tôi thấy rằng vấn đề này đang tự giải quyết. Bạn có thể kiểm tra bằng cách thực hiện một thông tin: truy vấn trên Google như thế này sẽ đưa ra URL mới.

kết quả google cho facebook.stackoverflow.com/q/3720459

Điều về thẻ chuẩn là đó là một lệnh có nghĩa là nó không hoạt động 100% thời gian. 301 chuyển hướng là như nhau - chúng không luôn vượt quá 100% trọng lượng thông qua chuyển hướng.

Ngoài ra với một trong hai người, phải mất vài tuần để Google hiểu rằng họ sẽ ở đó và nên được theo dõi. Đây là một vấn đề với các trang mới vì chúng xuất hiện trực tuyến và sẽ vào URL sai trong vài ngày / tuần trước khi Google tuân theo quy tắc.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.