Một tập tin Sơ đồ trang web giúp công cụ tìm kiếm để phát hiện các URL mới và cập nhật trên website của bạn. Đặc biệt, nếu trang web của bạn khá lớn, thì điều này có thể giúp họ có thể tập trung vào nội dung mới và cập nhật, thay vì phải mù quáng bò qua mọi thứ để xem có gì thay đổi không. Điều đó có thể dẫn đến nội dung mới được tìm thấy nhanh hơn nhiều, điều này có thể khá đáng chú ý đặc biệt là nếu trang web lớn hơn hoặc phức tạp hơn.
Với Google nói riêng (tôi làm việc tại Google; tôi không biết các công cụ tìm kiếm khác xử lý các công cụ này như thế nào), nó cũng thực hiện như sau:
- Tìm số lượng URL được lập chỉ mục cho trang web của bạn: Những thống kê này được tính toán lại hàng ngày và rất chính xác. Bạn có thể tìm thấy những thứ này trong trang chi tiết Sơ đồ trang web .
- Khám phá các vấn đề chuẩn hóa: Nếu các số ở đó không khớp nhau , đó thường là dấu hiệu bạn chỉ định URL trong tệp Sơ đồ trang web không khớp với những gì chúng tôi tìm thấy trong quá trình thu thập thông tin của chúng tôi. Đó thường là một dấu hiệu cho thấy bạn cần phải làm việc chuẩn hóa .
- Trợ giúp với việc chuẩn hóa: Khi chúng tôi tìm thấy nhiều URL trên trang web của bạn hiển thị nội dung giống hệt nhau, chúng tôi sẽ cung cấp cho bất kỳ URL nào được liệt kê trong Sơ đồ trang web thêm một cạnh, ngay cả khi bạn không sử dụng các phương pháp chuẩn hóa khác.
- Tìm các phần được lập chỉ mục xấu trên trang web của bạn: Các số này được cung cấp cho mỗi tệp Sơ đồ trang web, do đó bạn có thể tạo các tệp Sơ đồ trang web riêng cho các phần logic của trang web của mình, để khám phá các khu vực mà Google không lập chỉ mục nhiều như bạn muốn.
- Ưu tiên lỗi thu thập dữ liệu: Trong phần lỗi thu thập dữ liệu , các URL được chỉ định trong tệp Sơ đồ trang web được liệt kê riêng. Vì bạn đã cung cấp cụ thể các URL này, chúng tôi giả định rằng bạn muốn chúng được lập chỉ mục và bất kỳ lỗi thu thập dữ liệu nào cũng quan trọng.
Ngoài ra, bạn có thể sử dụng một số tiện ích mở rộng trong tệp Sơ đồ trang web (ví dụ: đối với hình ảnh, video, Tin tức hoặc quốc tế hóa), nếu bạn chọn thực hiện điều đó. Các phần mở rộng này là tất cả tùy chọn.
Đối với hầu hết các trang web, yếu tố dễ thấy nhất của tệp Sơ đồ trang web là bạn có thể thấy số lượng URL được lập chỉ mục. Có thể mất một ngày hoặc lâu hơn để xuất hiện, vì vậy nếu bạn chỉ gửi Sơ đồ trang web lần đầu tiên, bạn có thể cần phải kiên nhẫn một chút. Trong khi các cách khác (ví dụ: một trang web: -query) là các xấp xỉ rất, rất thô, thì số này cực kỳ chính xác.
Đã chỉnh sửa để thêm: một điều khác mà cá nhân tôi thấy cực kỳ hữu ích liên quan đến Sơ đồ trang web là nếu bạn không tạo chúng trực tiếp với CMS của mình, bạn luôn tìm hiểu rất nhiều về cách trang web của bạn có thể thu thập dữ liệu và loại URL nào được phát hiện trong quá trình đó Tôi đã thấy nhiều trường hợp thu thập dữ liệu trang web bằng công cụ về phía bạn (ví dụ: trình tạo Sơ đồ trang web) sẽ giải quyết các vấn đề mà bạn có thể bỏ lỡ, đó là ID phiên trong URL, trùng lặp nội dung thông qua chênh lệch URL, khoảng trắng vô hạn (chẳng hạn dưới dạng lịch vô tận) hoặc thậm chí là một phần của trang web không liên kết với nhau.