Làm cách nào để Google thu thập dữ liệu các trang AJAX mà không cần sử dụng #! URL?


13

Trong lời khuyên của Google về "Tạo các ứng dụng AJAX có thể thu thập dữ liệu" , họ khuyên nên tạo các URL AJAX không sử dụng các đoạn băm (#!) Có thể thu thập dữ liệu bằng cách thêm <meta name="fragment" content="!">vào trang <head>.

Có ai đã thành công với điều này? Tôi không thể tìm thấy Googlebot chụp ảnh nhanh HTML của các trang khi sử dụng 'Tìm nạp dưới dạng Googlebot' trong Công cụ quản trị trang web.


Tôi nghĩ rằng điều này có thể làm tốt hơn tại SO.
Su '

hấp dẫn. Có lẽ google không chụp ảnh mảnh vỡ. Là các url mảnh được lập chỉ mục?
SteveS

Câu trả lời:



4

Trong các phần mở đầu về việc cho phép thu thập nội dung AJAX, Google tuyên bố :


3. Xử lý các trang không có đoạn băm

Một số trang của bạn có thể không có các mảnh băm. Ví dụ, bạn có thể muốn trang chủ của mình www.example.comhơn là www.example.com#!home. Vì lý do này, chúng tôi có một điều khoản đặc biệt cho các trang không có các đoạn băm.

Lưu ý: Đảm bảo bạn chỉ sử dụng tùy chọn này cho các trang có chứa nội dung động do Ajax tạo. Đối với các trang chỉ có nội dung tĩnh, nó sẽ không cung cấp thêm thông tin cho trình thu thập thông tin, nhưng nó sẽ tăng thêm tải cho máy chủ của bạn và của Google.

Để tạo các trang không có các đoạn băm có thể thu thập dữ liệu, bạn bao gồm một thẻ meta đặc biệt trong phần đầu HTML của trang của bạn.

Thẻ meta có dạng sau:

<meta name="fragment" content="!">

Điều này cho biết trình thu thập thông tin rằng nó nên thu thập phiên bản xấu xí của URL này. Theo thỏa thuận trên, trình thu thập thông tin sẽ tạm thời ánh xạ URL đẹp đến URL xấu xí tương ứng. Nói cách khác, nếu bạn đặt vào trang www.example.com, trình thu thập thông tin sẽ tạm thời ánh xạ URL này tới www.example.com?_escaped_fragment_=và sẽ yêu cầu điều này từ máy chủ của bạn. Sau đó, máy chủ của bạn sẽ trả về ảnh chụp nhanh HTML tương ứng www.example.com. Xin lưu ý rằng một hạn chế quan trọng áp dụng cho thẻ meta này: nội dung hợp lệ duy nhất là "!". Nói cách khác, thẻ meta sẽ luôn có dạng chính xác : <meta name="fragment" content="!">, biểu thị một đoạn băm trống, nhưng một trang có nội dung AJAX.


Do đó, bạn vẫn cần kích hoạt ánh xạ URL tới phiên bản 'xấu xí' có chứa ?_escaped_fragment_=trình duyệt không đầu.

Họ theo dõi với cảnh báo:

Nếu nội dung www.example.com?_escaped_fragment_=trả về mã 404, sẽ không có nội dung nào được lập chỉ mục www.example.com!

Vì vậy, bạn nên kiểm tra cho điều đó là tốt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.