Bingbot thường mất bao lâu để xử lý việc gửi sơ đồ trang web?


14

Tôi đã gửi sitemap.xml của một tên miền cho Bingbot (trong Công cụ quản trị trang web).

Đã vài ngày trôi qua nhưng tình trạng vẫn đang chờ xử lý. Có ai biết Công cụ quản trị trang web Bing mất bao nhiêu thời gian để hoàn tất quy trình và hiển thị thông báo lỗi hoặc thành công không?


Vẫn còn một vấn đề trong năm 2014 :)
Eric Herlitz

Câu trả lời:


6

Bài này đã 4 tuổi, hy vọng tình trạng không chờ xử lý nữa. Nhưng điều này đã giúp tôi.

Sau 14 ngày ở trạng thái chờ xử lý, tôi đã tìm thấy liên kết này, để PING bing với sơ đồ trang web của bạn. Đó là một kiểu gọi tỉnh táo cho sơ đồ trang web của tôi. Vài giờ sau, trang web của tôi đã được lập chỉ mục.

  1. Tải lên sơ đồ trang web của bạn (nhưng bạn đã thực hiện do đó trạng thái chờ xử lý)
  2. Nhập vào trình duyệt của bạn: http://www.bing.com/webmaster/ping.aspx?siteMap= {url đầy đủ vào sơ đồ trang web của bạn)

Bạn nhận được phản hồi với nội dung như sau: Cảm ơn bạn đã gửi Sơ đồ trang web của bạn. Tham gia Công cụ quản trị trang web Bing để xem trạng thái Sơ đồ trang web của bạn và thêm các báo cáo về cách bạn đang làm trên Bing.


4

Dường như có một vấn đề với quá trình gửi sơ đồ trang web , quay trở lại ít nhất là đến đầu tháng 7 năm ngoái. Ghi chú cuối cùng về chủ đề đó đã được đăng cách đây vài ngày, nói rằng không có thay đổi trong tình hình của người bình luận. Có một số chủ đề khác nếu bạn chọc ngoáy, nhưng đó có vẻ là một chủ đề dài nhất và tôi đã thấy một nhân viên giới thiệu mọi người quay lại với nó, vì vậy nó có thể là một trong những thứ để xem nếu bạn muốn theo dõi bất kỳ sự phát triển nào.

Cho rằng điều này vẫn xảy ra mặc dù được JayGon xác định là "nhỏ", có vẻ như đó là mức độ ưu tiên thấp và bạn sẽ phải chờ. Tuy nhiên, hãy nhớ rằng sơ đồ trang web chủ yếu là các đề xuất hữu ích cho các công cụ tìm kiếm. Miễn là các trang của bạn có thể truy cập thông qua các liên kết bằng cách nào đó, chúng vẫn nên được lập chỉ mục, v.v.


1

Đối phó với Bing trong tuần này, tôi phát hiện ra nó hoạt động, nhưng đó là công cụ quản trị trang web rất chậm trễ.

Hai ngày sau khi gửi sơ đồ trang web, nó có trạng thái chờ xử lý, ngày thu thập thông tin cuối cùng là một ngày lạ từ quá khứ, nhưng trong thực tế bingbotđã tìm kiếm trang web của tôi.

Tôi có quyền truy cập vào nhật ký máy chủ của mình, Bing đã ở đó hai lần và nó cũng đã lập chỉ mục.

Bản ghi nhật ký Apache để tìm nạp sơ đồ trang web của tôi trông như thế này:

157.55.39.216 - - [05/Dec/2016:01:58:01 +0100] "GET /sitemap.txt HTTP/1.1" 200 63422 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

Tôi đã thấy hai trong số đó, Bing cũng đang tìm kiếm robots.txtvà khoảng một phần ba trang của tôi, tất cả đều có trạng thái 200, có nghĩa là OK, sau đó nó dừng lại.

Hai ngày sau, chưa có công cụ quản trị trang web nào, sự kiện đang chờ xử lý để gửi sơ đồ trang web, nhưng kết quả tìm kiếm của tôi bắt đầu hiển thị trong tìm kiếm Bing.com một cách ngẫu nhiên. Khi họ xuất hiện, tôi tìm kiếm trang web: mywebsitename.com, năm phút sau cùng một truy vấn cho thấy 0 kết quả.

Tôi đã cố gắng từ chối liên kết bằng công cụ Disavow của họ, liên kết xuất hiện bí ẩn trong kết quả tìm kiếm Bing, một cái gì đó như mywebsitename.com/ppc/click/123456 một trang không tồn tại, tôi thậm chí còn làm cho nó ném 404 trong vài tuần, hai ngày sau liên kết vẫn hiển thị trong kết quả tìm kiếm.

Công cụ quản trị trang web Bing dành cho người kiên nhẫn và mọi thứ đều cần có thời gian, có vẻ như chúng không còn được duy trì nữa.


0

Tìm thấy điều này trong các trang Google Webmaster. Tôi có thể tưởng tượng nó cũng áp dụng cho Bing.

Robot thất bại là gì? Đây là một lỗi để truy xuất tệp robot.txt của trang web của bạn. Trước khi Googlebot thu thập dữ liệu trang web của bạn và khoảng một ngày một lần sau đó, Googlebot sẽ truy xuất tệp robot.txt của bạn để xem trang nào không nên thu thập dữ liệu. Nếu tệp robot.txt của bạn tồn tại nhưng không thể truy cập được (nói cách khác, nếu nó không trả về mã trạng thái HTTP 200 hoặc 404), chúng tôi sẽ hoãn thu thập thông tin của chúng tôi thay vì rủi ro khi thu thập dữ liệu URL mà bạn không muốn thu thập dữ liệu. Khi điều này xảy ra, Googlebot sẽ quay lại trang web của bạn và thu thập dữ liệu ngay khi chúng tôi có thể truy cập thành công tệp robot.txt của bạn. Thông tin thêm về giao thức loại trừ robot. https://support.google.com/webmasters đá / 351120? hl = vi

điều đó có nghĩa là, chỉ cần gửi một sitemap.xml là không đủ. đảm bảo bạn có robot.txt của bạn


Không có tệp robot.txt sẽ không làm chậm quá trình thu thập dữ liệu của bạn. Không có nó sẽ trả về một 404 Not Foundtrạng thái là một trong hai trạng thái mà họ mong đợi cho robot.txt. Đoạn đó là khi có một loại lỗi như 500 Internal Server Errorkhi robots.txt quyến rũ. Mặc dù tình huống như vậy sẽ gây ra sự chậm trễ trong việc xử lý sơ đồ trang web, nhưng đây là tình huống hiếm gặp không có khả năng gây ra sự cố cho người đặt câu hỏi hoặc cho bất kỳ ai có vấn đề tương tự.
Stephen Ostermiller
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.