Có bất kỳ chỉ số rõ ràng rằng tập tin sơ đồ trang web của tôi là có lợi?


73

Gần đây tôi đã tạo một tệp sitemap.xml và tải nó lên tài khoản Google Webmasters Tools của mình. Google đã không báo cáo bất kỳ vấn đề hoặc lỗi với sơ đồ trang web được tải lên của trang web của tôi.

Bây giờ câu hỏi của tôi là:

  • Làm cách nào để biết liệu sơ đồ trang web của tôi có hoạt động trong Công cụ quản trị trang web của Google không?

Lý do tôi hỏi là tôi không biết những gì tôi cho là đang nhìn thấy hoặc tìm kiếm, và cảm giác như tôi đã tải lên một tập tin vô dụng.

Câu trả lời:


93

Một tập tin Sơ đồ trang web giúp công cụ tìm kiếm để phát hiện các URL mới và cập nhật trên website của bạn. Đặc biệt, nếu trang web của bạn khá lớn, thì điều này có thể giúp họ có thể tập trung vào nội dung mới và cập nhật, thay vì phải mù quáng bò qua mọi thứ để xem có gì thay đổi không. Điều đó có thể dẫn đến nội dung mới được tìm thấy nhanh hơn nhiều, điều này có thể khá đáng chú ý đặc biệt là nếu trang web lớn hơn hoặc phức tạp hơn.

Với Google nói riêng (tôi làm việc tại Google; tôi không biết các công cụ tìm kiếm khác xử lý các công cụ này như thế nào), nó cũng thực hiện như sau:

  • Tìm số lượng URL được lập chỉ mục cho trang web của bạn: Những thống kê này được tính toán lại hàng ngày và rất chính xác. Bạn có thể tìm thấy những thứ này trong trang chi tiết Sơ đồ trang web .
  • Khám phá các vấn đề chuẩn hóa: Nếu các số ở đó không khớp nhau , đó thường là dấu hiệu bạn chỉ định URL trong tệp Sơ đồ trang web không khớp với những gì chúng tôi tìm thấy trong quá trình thu thập thông tin của chúng tôi. Đó thường là một dấu hiệu cho thấy bạn cần phải làm việc chuẩn hóa .
  • Trợ giúp với việc chuẩn hóa: Khi chúng tôi tìm thấy nhiều URL trên trang web của bạn hiển thị nội dung giống hệt nhau, chúng tôi sẽ cung cấp cho bất kỳ URL nào được liệt kê trong Sơ đồ trang web thêm một cạnh, ngay cả khi bạn không sử dụng các phương pháp chuẩn hóa khác.
  • Tìm các phần được lập chỉ mục xấu trên trang web của bạn: Các số này được cung cấp cho mỗi tệp Sơ đồ trang web, do đó bạn có thể tạo các tệp Sơ đồ trang web riêng cho các phần logic của trang web của mình, để khám phá các khu vực mà Google không lập chỉ mục nhiều như bạn muốn.
  • Ưu tiên lỗi thu thập dữ liệu: Trong phần lỗi thu thập dữ liệu , các URL được chỉ định trong tệp Sơ đồ trang web được liệt kê riêng. Vì bạn đã cung cấp cụ thể các URL này, chúng tôi giả định rằng bạn muốn chúng được lập chỉ mục và bất kỳ lỗi thu thập dữ liệu nào cũng quan trọng.

Ngoài ra, bạn có thể sử dụng một số tiện ích mở rộng trong tệp Sơ đồ trang web (ví dụ: đối với hình ảnh, video, Tin tức hoặc quốc tế hóa), nếu bạn chọn thực hiện điều đó. Các phần mở rộng này là tất cả tùy chọn.

Đối với hầu hết các trang web, yếu tố dễ thấy nhất của tệp Sơ đồ trang web là bạn có thể thấy số lượng URL được lập chỉ mục. Có thể mất một ngày hoặc lâu hơn để xuất hiện, vì vậy nếu bạn chỉ gửi Sơ đồ trang web lần đầu tiên, bạn có thể cần phải kiên nhẫn một chút. Trong khi các cách khác (ví dụ: một trang web: -query) là các xấp xỉ rất, rất thô, thì số này cực kỳ chính xác.

Đã chỉnh sửa để thêm: một điều khác mà cá nhân tôi thấy cực kỳ hữu ích liên quan đến Sơ đồ trang web là nếu bạn không tạo chúng trực tiếp với CMS của mình, bạn luôn tìm hiểu rất nhiều về cách trang web của bạn có thể thu thập dữ liệu và loại URL nào được phát hiện trong quá trình đó Tôi đã thấy nhiều trường hợp thu thập dữ liệu trang web bằng công cụ về phía bạn (ví dụ: trình tạo Sơ đồ trang web) sẽ giải quyết các vấn đề mà bạn có thể bỏ lỡ, đó là ID phiên trong URL, trùng lặp nội dung thông qua chênh lệch URL, khoảng trắng vô hạn (chẳng hạn dưới dạng lịch vô tận) hoặc thậm chí là một phần của trang web không liên kết với nhau.


Thông tin tuyệt vời. Tôi cũng đã nghe nói rằng với một số trang web có lưu lượng truy cập cao được thu thập dữ liệu tốt hơn, không nên sử dụng sơ đồ trang web vì Google thực hiện công việc thu thập dữ liệu tốt hơn và nếu có bất cứ điều gì thiếu trong sơ đồ trang web của bạn, nó có thể ngừng được lập chỉ mục.
Chris_O

3
@Chris_O Bạn đang trộn lẫn các vấn đề khác nhau với nhau. Trong ví dụ đó, không phải Google đang tự mình làm một công việc "tốt hơn"; sơ đồ trang web bị lỗi. Đó không phải là một dòng đối số trực tiếp để "hoàn toàn không sử dụng sơ đồ trang web." Giải pháp cho tình huống đó là sửa sơ đồ trang web. Ngoài ra, sơ đồ trang web là thông tin, không phải chỉ thị. Một cái gì đó bị thiếu trong sơ đồ trang web không có nghĩa là Google sẽ không tự mình tìm thấy hoặc bỏ qua nó.
Su '

Trang web được đề cập có hơn 40 nghìn trang được lập chỉ mục và nội dung mới sẽ được lập chỉ mục trong vòng chưa đầy 5 phút (không có bản đồ trang web). Dựa trên câu trả lời của bạn, chúng tôi sẽ bắt đầu xây dựng chúng và chia chúng thành nhiều năm.
Chris_O

@ john-mueller hi mr. m. - tôi đã từng gửi sơ đồ trang web thử nghiệm với 1000 URL, chúng tôi đã lấy lại số chỉ mục khoảng 700, bây giờ chúng tôi đã kiểm tra tất cả 1000 URL qua trang web: www.complete.org/url/to/the/page.html, chúng tôi đã quay lại một cách đếm dưới 700 url (nhiều hơn trong khu vực 200). Điều đó có nghĩa là gì?
Franz

2
@Franz Đôi khi có những chi tiết liên quan khiến bạn khó tái tạo số lượng URL được lập chỉ mục với trang web: -queries. Ví dụ: có những tình huống chúng tôi có thể kết hợp nhiều URL và chỉ hiển thị một trong số chúng cho một trang web: -query. Vì vậy, nếu bạn thấy một sự khác biệt ở đó, nó thường không đáng lo ngại.
John Mueller

6

Nếu bạn không nhận được bất kỳ lỗi nào thì bạn có thể cho rằng Google đã phân tích cú pháp và nhận thức được nội dung. Nhưng điều đó không có nghĩa là họ sẽ thu thập dữ liệu và / hoặc lập chỉ mục các trang đó. Sơ đồ trang web chỉ là một cách khác để nói với các công cụ tìm kiếm về các trang của bạn. Họ không bắt buộc phải thu thập dữ liệu và lập chỉ mục bất kỳ hoặc tất cả các trang đó. Điều tương tự áp dụng cho họ tìm các trang thông qua các liên kết hoặc gửi URL.


1
Như đã thêm thông tin, thật dễ dàng để xem Google có hiểu sơ đồ trang web hay không. Kiểm tra trong Tối ưu hóa -> Sơ đồ trang web. Nó sẽ cho bạn biết có bao nhiêu URL đã được gửi trong sơ đồ trang web. Sơ đồ trang web được đọc thành công nội dung và tìm thấy nhiều liên kết trong đó. Số thứ hai là số lượng đã được lập chỉ mục và như John chỉ ra, hoàn toàn phụ thuộc vào Google về việc họ có tìm thấy không, một số hoặc hầu hết nội dung của bạn đáng giá hay không. Nó sẽ luôn luôn ít hơn số tiền được gửi, Google chỉ tìm thấy một số trang không quá hấp dẫn và không bận tâm đến chúng.
Phòng thí nghiệm Fiasco

1

Google thường làm tốt việc thu thập dữ liệu trang web của bạn nếu bạn có số lượng liên kết chất lượng tốt. Nếu bạn dành nhiều thời gian để xem số lượng trang bạn đã lập chỉ mục, tôi sẽ đề nghị tốt hơn để cải thiện trang web của bạn và nhận được một số liên kết chất lượng.


0

Có thể một công cụ xác thực sơ đồ trang web như thế này , mặc dù tôi chưa bao giờ "không" thấy sơ đồ trang web bắt đầu hoạt động.


Các tập tin đã được xác nhận. Đó không phải là câu hỏi.
Su '

0

Đối với trang web lớn hơn, ví dụ trang web có hàng trăm, hàng nghìn hoặc hàng triệu trang, nó khá hữu ích. Chúng tôi đã có trong trang web công ty của chúng tôi với 400 000 trang trong đó URL được tạo động bởi ID nội dung và tham số URL được sử dụng với &, Google Webmaster Tools sẽ cung cấp cho bạn phản hồi trên các trang được thu thập thông tin và hiển thị cho bạn lỗi, bạn có thể gỡ lỗi hoặc mở trang và xem cho chính mình những gì là sai. Bằng cách này, Google thực sự đã giúp chúng tôi tạo ra một trang web tốt hơn và tránh cho chúng tôi khỏi sự bối rối lớn vài lần.

Nó cũng hữu ích để xem số lượng trang được lập chỉ mục so với số lượng được thu thập thông tin.

Đối với các trang web nhỏ hơn, nếu trang web là một nhóm nhỏ các trang .html trong đó mỗi trang được liên kết thông qua menu và trang web không được cập nhật thường xuyên, nếu bạn tải lên sơ đồ trang web, sẽ không có gì thay đổi so với kết quả tìm kiếm. Bạn sẽ không có bất kỳ lợi thế nào khi tải lên sơ đồ trang web so với ai đó không tải lên sơ đồ trang web.

Tôi cũng đã từng có khoảng 20 trang web nhỏ, nơi tôi có sơ đồ trang web được tạo bởi tập lệnh cron tự động và tôi đã ngừng làm điều đó. Một ngày nọ tôi phát hiện ra rằng các tệp XML không được tạo chính xác trong khoảng 6 tháng do lỗi của tôi, nhưng Google đã bỏ qua lỗi của tôi và lập chỉ mục đầy đủ cho các trang web này ngay cả khi sơ đồ trang web có lỗi, Google sử dụng sơ đồ trang web như một gợi ý đi đâu, không phải rất nghiêm túc.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.