Tham số URL ở đâu? Chocaid = 397 Lần đến từ đâu?


9

Trong Google Webmaster Tools, tôi nhận thấy rằng trang trước của tôi đã được lập chỉ mục hai lần:

  • example.com/
  • example.com/?chocaid=397

Tôi biết rằng tôi có thể khắc phục điều này bằng cách sử dụng loại liên kết canonical, nhưng tôi tự hỏi: tham số này đến từ đâu?

Có nhiều trang web khác nhau có các trang được lập chỉ mục với chính tham số / giá trị này: https://duckduckgo.com/?q=chocaid%3D394 .

Tôi tìm kiếm sự tương đồng giữa các trang web này. nhưng không thể tìm thấy một kết luận: Nó thường là trang nhất, nhưng không phải trong mọi trường hợp. Một số là NSFW, nhưng không phải tất cả. Khi URL của một tên miền có tham số này, thường thì các tên miền phụ khác của cùng tên miền cũng có tham số đó.

Ví dụ

Mục nhập Wikipedia

nhập mô tả hình ảnh ở đây

Bộ giải mã Microsoft

nhập mô tả hình ảnh ở đây


Trong Google Webmaster Tools (hoặc nhật ký người giới thiệu của bạn) có bất kỳ dấu hiệu nào cho thấy trang nào có thể được liên kết đến URL này không?
MrWhite

@ w3d: Tôi không có quyền truy cập vào bất kỳ nhật ký nào. Trong GWT, nó được liệt kê trong " Cải tiến HTML " → "tiêu đề trang lặp lại". Vì vậy, tôi sợ rằng tôi không thể có được bất kỳ thông tin giới thiệu.
unor

Tôi chỉ tự hỏi liệu có bất cứ điều gì trong Lưu lượng truy cập> Liên kết đến trang web của bạn> Nội dung được liên kết nhiều nhất của bạn> Khác (để có được tất cả các trang được liên kết). Để ?chocaid=397được lập chỉ mục sau đó có lẽ một cái gì đó đang liên kết với nó để Google tìm liên kết ở vị trí đầu tiên?
MrWhite

@ w3d: À, tôi hiểu rồi. Thật không may, dữ liệu vẫn còn thiếu cho báo cáo này (có lẽ vì tôi chỉ sử dụng GWT trong một vài ngày).
unor

Không chắc điều này có giúp ích gì không, nhưng số 397 có liên quan đến băm (xem tại đâyđây ). Tôi không chắc liệu điều này có liên quan gì đến câu hỏi này không, nhưng ?chocaid=397có thể là một số nỗ lực gây rối với băm (tôi không biết nhiều về điều này, vì vậy tôi không chắc chắn về điều này). Ngoài ra, đây là một câu hỏi tuyệt vời.

Câu trả lời:


1

Tên miền của bạn mới như thế nào? Rất có thể đây là một truy vấn phổ biến trên tên miền cũ và do đó bạn vẫn nhận được "khách truy cập". Bản đồ này đến một trang hợp lệ hay 404? Nếu bạn đang nhận được rất nhiều lượt truy cập ở đó và đó là 404, thì tôi sẽ ánh xạ lại (sử dụng .htaccess) vào trang chủ của bạn hoặc một cái gì đó.


1
Tôi chưa nhận thấy bất kỳ du khách nào; Tôi thấy trang được lập chỉ mục bởi Google. Nó ánh xạ tới cùng một trang trước (như thể tham số bị bỏ qua). Tôi biết rằng tôi có thể chuyển hướng nó hoặc sử dụng canonical, nhưng câu hỏi này là về nguồn gốc của tham số này.
unor

2
Nhưng điều này không giải thích tại sao cùng một tham số URL xuất hiện trong kết quả tìm kiếm cho nhiều tên miền khác.
MrWhite

1

Có thể Googlebot đang cố truy cập jQuery / Javascript và thu thập dữ liệu mọi thứ có thể. Có một bài đăng gần đây trên đây về một người nào đó yêu cầu trợ giúp vì Googlebot đang thu thập dữ liệu URL không hợp lệ trên trang web của họ. John M đã trả lời về cách Googlebot có thể đang tìm kiếm thêm URL để thu thập dữ liệu từ các tập lệnh trên trang web của họ. Anh ấy làm việc cho Google Webmaster Tools. Bạn đã trả lời khá nhiều câu hỏi của riêng bạn bằng cách đặt thẻ chuẩn.


1

Trong khi tôi không có câu trả lời chắc chắn, có một vài điều tôi đã tìm thấy trong khi xem xét điều này có thể giúp thu hẹp nó:

  • Các liên kết cũng xuất hiện trong Bing và Yahoo, vì vậy nó không liên quan gì đến Google.
  • Chúng xuất hiện trên wiki, blog Tumblr, blog Wordpress và các trang web khác, và vì vậy chúng sẽ không được thêm vào thông qua khai thác trong bất kỳ phần mềm cụ thể nào.
  • Chúng xuất hiện trên một số trang Tumblr chất lượng rất thấp, và do đó không chắc là những trang này sẽ có bất kỳ quảng cáo nào đến với chúng. Tương tự như vậy, các bài viết trên wikipedia dường như không được quảng bá thông qua quảng cáo.

Dự đoán tốt nhất của tôi sẽ là có / có một số trang web cạp có thêm URL này vào tất cả các liên kết mà nó tìm thấy. Chắc chắn, các liên kết bên ngoài dường như là lời giải thích khả dĩ nhất cho việc chúng đến từ đâu và các thư mục không thể xảy ra do thực tế nó đang được thêm vào các trang khá ngẫu nhiên.


0

Đây có thể là từ một nhà cung cấp quảng cáo mà bạn có thể gặp phải, tôi có cùng một vấn đề và nơi duy nhất có thể xuất phát là từ một nhà cung cấp quảng cáo tiêm một số phần mềm độc hại thông qua mã javascript.


Bạn có một nguồn / bằng chứng cho điều này? Điều đó có nghĩa là Wikipedia bị nhiễm bởi điều này, vì có một số Wikipedia phân trang được lập chỉ mục với tham số này.
unor

Vâng bởi vì tôi có một blog mà Google đã chặn do điều này và sau khi xóa quảng cáo thủ phạm, họ bắt đầu xóa khối
Raymund
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.