Chúng tôi đang thấy một số trang tồn tại trong chúng tôi sitemap.xml
nhưng bị thiếu một cách không thể giải thích được từ chỉ mục tìm kiếm công khai của Google.
Bạn không thể tải xuống /superuser//sitemap.xml - chúng tôi bảo vệ tệp này vì trước đây đã có vấn đề với nó - nhưng googlebot thì có thể. Chúng tôi đã xác minh thông qua Google Webmaster Tools rằng sitemap.xml
tệp đã được kéo xuống hôm nay và được đánh giá là OK không có lỗi (dấu kiểm màu xanh lá cây).
Có sitemap.xml
chứa một danh sách 50.000 câu hỏi cuối cùng trên trang web của chúng tôi đã được hỏi. Ví dụ, câu hỏi này ...
/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links
... tồn tại trong sitemap.xml
...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
Tìm kiếm "Làm thế nào để thấy sự kết thúc của một chuỗi dài các liên kết tượng trưng" chỉ cung cấp một kết quả cho Questiolahoma.com đang làm mất dữ liệu của chúng tôi (một vấn đề hoàn toàn khác).
Bạn có thể tăng số lượng câu hỏi và thực hiện tìm kiếm chính xác cho tiêu đề câu hỏi và bạn sẽ thấy mẫu này vẫn tồn tại.
Các url này có trong sitemap.xml nhưng chúng không hiển thị trong chỉ mục của Google - và chúng vẫn hiển thị trên các trang web cạo dữ liệu chung của chúng tôi. Tại sao lại như vậy?