Tại sao các trang lập chỉ mục của Google có chuỗi truy vấn? Utm_campaign


9

Gần đây tôi đã nhận thấy rằng Google đang lập chỉ mục các URL chứa các đối số chuỗi truy vấn utm_campaign, utm_source và utm_medium. Trong kết quả, Google hiển thị URL với các chuỗi truy vấn này thay vì URL chuẩn:

utm_campaign được thêm vào URL

Tôi hiểu đây có thể là sự cố 'nội dung trùng lặp', nhưng tôi đã sử dụng link rel=canonicalthẻ trên khắp trang web của mình. Như một ví dụ:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

Ảnh chụp màn hình của thẻ chuẩn

Kỳ vọng của tôi là Google nên sử dụng URL chuẩn để lập chỉ mục. Tôi đang làm gì sai?


2
Ngay cả khi không có thẻ chuẩn, Googlebot thường bỏ qua các tham số UTM vì nó biết chúng chỉ được sử dụng để theo dõi. Tôi chưa bao giờ thấy chúng được lập chỉ mục trước đây, đặc biệt là không có kinh điển.
Stephen Ostermiller

4
FWIW site:stackexchange.com inurl:utm_campaigncũng trả về kết quả tương tự (ở quy mô lớn hơn một chút). Cũng lưu ý rằng site:các tìm kiếm thường trả về các URL không chính tắc trong kết quả, thông thường không được trả về trong các tìm kiếm "thông thường". Tuy nhiên, các URL trên dường như cũng được trả lại trong các tìm kiếm "bình thường".
MrWhite

Câu trả lời:


3

Xem xét trang web của bạn như bây giờ, tôi không chắc chắn nếu đây là một vấn đề nữa / hiện tại.

Vấn đề không phải là liên kết nội bộ trên trang web của bạn với việc bao gồm các tham số UTM (như một câu hỏi khác cho thấy).

Có vẻ như một số quy trình bạn phải chia sẻ nội dung trang web của mình trên phương tiện truyền thông xã hội đang để lại các tham số UTM trong các URL và chia sẻ các URL đó, tại một số điểm, dẫn đến việc chúng được lập chỉ mục.

Rất hiếm khi điều này xảy ra, nhưng nó đã xảy ra với nhiều trang web khác trước đây. Việc chỉ có ba trang được lập chỉ mục với các tham số này là dấu hiệu cho thấy đây không phải là vấn đề nghiêm trọng cũng không phải là vấn đề liên quan.

Dưới đây là các bước bạn có thể thực hiện để giúp loại bỏ điều này xảy ra: -

1. Chỉ định một URL chuẩn trên các trang của bạn

Bạn đã làm điều này và việc thực hiện là chính xác. Điều này sẽ đảm bảo chỉ URL chính được chỉ định sẽ được đặt trọng số trong các công cụ tìm kiếm. Có lẽ điều này luôn luôn được đặt ra nhưng nếu không, thì điều này có thể giải thích tại sao có một số trường hợp cũ của các trang vẫn được lập chỉ mục với các tham số UTM.

Thực hiện đúng các URL chuẩn

2. Hướng dẫn Google không lập chỉ mục các tham số UTM trong Search Console

Trong trường hợp một số URL đang được lập chỉ mục với các tham số UTM (như trường hợp của bạn), tham số URL sẽ xuất hiện dưới dạng được phát hiện trong phần 'Thu thập thông tin> Thông số URL của Google Search Console cho tên miền của bạn (xem bên dưới).

Thông số URL UTM của Google Search Console

Ngay cả khi các tham số UTM không xuất hiện, bạn có thể 'Thêm tham số' để tạo chúng.

Chỉ cần chọn No: Doesn't affect page content (ex: tracks usage)(được gọi là 'Thông số thụ động') và Google thường sẽ chỉ thu thập dữ liệu chỉ một URL với một giá trị tham số cụ thể .

3 Không cho phép các tham số URL trong tệp robots.txt của bạn

Điều này sẽ chặn Google lập chỉ mục nội dung của các URL này nhưng không phải là các URL thực tế (chúng vẫn có thể hiển thị trong kết quả tìm kiếm nhưng sẽ chỉ bỏ qua phần mô tả như bên dưới).

Trang được lập chỉ mục không được phép trong tệp robots.txt

Chỉ cần thêm một cái gì đó như sau sẽ xử lý việc này từ robots.txt: -

Disallow: /*?utm=*

Phần kết luận

Bước 1 và # 2 nên được thực hiện như một vấn đề phòng ngừa và "thực hành tốt nhất" dù sao đi nữa và bước # 3 ngoài các bước # 1 và # 2 có lẽ (vì sẽ không có hiệu quả).

Trong Google Search Console, cũng có khả năng (tạm thời) xóa URL. Điều này đặc biệt hữu ích nếu có một số trang cứng đầu vẫn được lập chỉ mục nhưng bạn biết nguồn gốc của vấn đề đã được giải quyết và cơ sở này phải đủ để loại bỏ chúng một lần và mãi mãi khỏi kết quả tìm kiếm.

Tôi chưa bao gồm điều này như một bước ở trên, mặc dù đã nghiên cứu điều này trước đây, tôi không thể nhớ liệu nó có hỗ trợ URL với các tham số [cần dẫn nguồn] hay không. Tôi đã từng biết câu trả lời nhưng trí nhớ của tôi làm tôi thất vọng trong dịp đặc biệt này.

Đọc thêm về việc xóa URL khỏi Google .


1
Nhưng nếu bạn chặn các URL này được thu thập thông tin bằng cách sử dụng robots.txt(# 3) thì bạn cũng sẽ không chặn các chiến dịch này bị theo dõi chứ? ... Và cũng ngăn không cho đọc thẻ chuẩn trong trang (# 1)?
MrWhite

Tôi đồng tình với những gì w3dk nói về robot.txt. Nếu bất cứ điều gì sử dụng noindex: /*?utm=*trong robot.txt.
Stephen Ostermiller

2

Có vẻ như bạn đang sử dụng các liên kết này bên trong nội dung trang web của bạn để liên kết các trang với nhau.

Để đảm bảo Google sẽ không lập chỉ mục, bạn có thể thêm rel="nofollow"vào các liên kết này trong trang web của mình và chặn các thông số này khỏi tệp robot.txt:

Disallow : /*utm_campaign

Bắt tốt rằng chúng được sử dụng cho các liên kết nội bộ. Điều đó sẽ giải thích sự khác biệt từ hầu hết các trang web nơi chúng thường chỉ được sử dụng trên các liên kết trong.
Stephen Ostermiller

Trên thực tế, các URL utm_campaign được thêm vào bởi Buffer.com - ví dụ: chúng trông giống như "utm_source = plus.google.com & utm_campaign = buffer". Tôi không nghĩ rằng tôi đang sử dụng các liên kết này bất cứ nơi nào trên trang web.
Brendon

1

Bạn đã kiểm tra xem URL chuẩn của bạn đã được lập chỉ mục hay chưa? Nếu URL chính tắc đã được lập chỉ mục thì không có gì phải lo lắng.

Bạn có thể dùng thử Công cụ quản trị trang web của Google và thay đổi cách Google xử lý các tham số URL tại đây .


1
Đối với một số URL, chỉ URL utm_campaign được lập chỉ mục. Đối với các trang khác, cả hai URL hiển thị trong chỉ mục. Hôm qua, tôi đã sử dụng công cụ Fetch as Google để thu thập dữ liệu một URL (với chuỗi truy vấn utm_campaign) - URL đó dường như đã biến mất và URL chính tắc hiện được lập chỉ mục.
Brendon

Ngoài ra, số liệu thống kê thu thập dữ liệu ( ảnh chụp màn hình ) dường như hiển thị các trang mất nhiều thời gian để thu thập dữ liệu (trung bình 2,3 giây). Tôi không chắc đây có phải là sự cố phổ biến không, nhưng có lẽ Google đang gặp một số vấn đề khi thu thập dữ liệu trang web.
Brendon

Bạn cũng có thể dọn dẹp một chút khi khách truy cập vào trang web của bạn. Sử dụng liên kết Tập lệnh URL mới để tự động xóa bất kỳ tham số UTM nào khỏi URL sau khi nhận được lợi ích từ nó. Thứ hai thêm các tham số URL ...
muhammad usman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.