Có (ít nhất) hai lý do phổ biến tại sao các URL lạ và sai lệch có thể hiển thị là lỗi thu thập dữ liệu trong Công cụ quản trị trang web.
Khả năng đầu tiên là ai đó đã sao chép các trang của bạn (hoặc một số trang khác liên kết đến trang của bạn) và xử lý các liên kết trong quy trình. Điều này xảy ra thường xuyên hơn bạn nghĩ; xem ví dụ câu hỏi thứ sáu trong bài đăng trên blog của Google Webmaster này .
Khả năng khác là chính Googlebot đang cố gắng làm theo những gì họ nghĩ là các liên kết JavaScript và làm cho nó trở nên lộn xộn . Bạn thường có thể phân biệt hai trường hợp này bằng cách truy cập trang giới thiệu ( cần tồn tại và có thể truy cập được, nếu Google quản lý để thu thập thông tin để bắt đầu) và tìm kiếm tên của trang đích trong nguồn.
Dù bằng cách nào, về cơ bản, có hai điều bạn có thể làm: chỉ cần bỏ qua các liên kết hoặc đưa ra một số quy tắc viết lại để thử và ánh xạ các URL bị hỏng thành các hoạt động. Nếu bạn có thể thấy một mẫu rõ ràng trong các URL và quen thuộc với biểu thức chính quy, tôi khuyên bạn nên sử dụng cách tiếp cận sau - nó sẽ xóa danh sách lỗi thu thập dữ liệu của bạn và thậm chí có thể cung cấp cho bạn một mức tăng nhỏ, nhưng thực tế, nhưng PageRank .
Tùy chọn thứ ba, nếu bạn thấy rằng ai đó đang sao chép nội dung của bạn mà không được phép, là thử và xóa chúng . Bạn thậm chí có thể gửi khiếu nại (và / hoặc yêu cầu gỡ xuống chính thức) cho nhà cung cấp dịch vụ lưu trữ của họ, nếu bạn tin rằng nó hợp lý. Tất nhiên, do họ rõ ràng đang liên kết trở lại trang web của bạn, bạn có thể không nhất thiết phải thấy điều đó đáng để nỗ lực.