Nếu tôi nhúng hình ảnh vào một trang dưới dạng img
- src
với URI dữ liệu cơ sở64, liệu siêu dữ liệu của hình ảnh (EXIF, IPTC, XMP) có còn khả dụng cho imagebot của Google không?
Nếu tôi nhúng hình ảnh vào một trang dưới dạng img
- src
với URI dữ liệu cơ sở64, liệu siêu dữ liệu của hình ảnh (EXIF, IPTC, XMP) có còn khả dụng cho imagebot của Google không?
Câu trả lời:
Google không lập chỉ mục hình ảnh URI dữ liệu cho tìm kiếm hình ảnh của Google. John Mueller của Google nói như vậy ở đây và trong các bình luận bên dưới. Vì hình ảnh URI dữ liệu không được lập chỉ mục trong tìm kiếm hình ảnh của Google, dữ liệu EXIF trong đó không liên quan.
Bạn có thể xác minh rằng những hình ảnh này không được lập chỉ mục. Tôi đã tìm kiếm hình ảnh của Google cho "dữ liệu uri" và kiểm tra kết quả. Tất cả các hình ảnh tôi đã xem là các tệp hình ảnh, không phải URI hình ảnh được mã hóa base64. Bạn sẽ nghĩ rằng nếu Google có thể lập chỉ mục hình ảnh URI dữ liệu, một số trong số chúng sẽ hiển thị trong kết quả tìm kiếm cho cụm từ đó.
Nếu Google không bao giờ quyết định lập chỉ mục hình ảnh URI dữ liệu, họ sẽ có thể nhận được dữ liệu EXIF từ họ. Dữ liệu uri là toàn bộ tệp base64 được mã hóa (không có khoảng trắng hoặc dòng mới) với data:image/png;base64,
tiền tố. Mọi dữ liệu meta trong tệp sẽ vẫn có trong phiên bản URI dữ liệu được mã hóa base64.
Tôi sử dụng hình ảnh URI dữ liệu trên một trong các trang web của mình. Tôi làm như vậy bởi vì người dùng thường chỉ xem một trang trên trang web để có được tất cả thông tin họ cần. Bao gồm tất cả CSS, JS và dữ liệu hình ảnh nội tuyến trong trang sẽ cải thiện hiệu suất đáng kể. Các hình ảnh đều nhỏ, vì vậy kỹ thuật hoạt động đặc biệt tốt.
Trang web của tôi nhận được một lượng lưu lượng truy cập khá lớn từ Internet Explorer 7 và trước đó không hỗ trợ hình ảnh URI dữ liệu. Vì vậy tôi phải phục vụ họ một cách có điều kiện. Tôi cũng có hình ảnh trên máy chủ và tôi chọn URL hình ảnh thông thường hoặc URI dữ liệu dựa trên User-Agent
tiêu đề. Tôi coi các bot (bao gồm Googlebot) giống như IE 7, tức là tôi phục vụ hình ảnh dưới dạng URL HTTP. Tôi làm điều này bởi vì bao gồm hình ảnh uri dữ liệu làm tăng đáng kể kích thước trang. Hầu hết các bot không cần tải xuống hình ảnh, vì vậy nó hiệu quả hơn đối với chúng. Tôi cũng đã nhận thấy rằng Google Webmaster Tools đã báo cáo Googlebot đang thu thập dữ liệu trang web của tôi chậm hơn nhiều với hình ảnh URI dữ liệu được bật cho nó. Điều này về mặt kỹ thuật có thể được coi là che giấu, nhưng nó sẽ là một cách để lấy hình ảnh URI dữ liệu của bạn được lập chỉ mục.
Mặc dù Google sử dụng hình ảnh dưới dạng URI dữ liệu được mã hóa base64 trên SERP của riêng mình, nhưng Google không lập chỉ mục các hình ảnh đó trên các trang web khác. Cảm ơn @dan, người đã chỉ cho tôi cuộc thảo luận về Google Groups, nơi John Mueller giải thích vấn đề này . Điều đó cũng có nghĩa là câu hỏi về sự tồn tại của dữ liệu EXIF trong các hình ảnh đó không liên quan.
Giải thích này cho thấy rõ, hình ảnh nào là kỹ thuật tối ưu hóa hiệu suất này tốt hơn để áp dụng: hình ảnh nhỏ, như biểu tượng, favicon và nút và những hình ảnh đó, không cung cấp bất kỳ giá trị bổ sung nào cho nội dung của trang web.
Trên trang khác, nếu một người phân loại phải nhúng hình ảnh VỚI giá trị nội dung bổ sung dưới dạng URI dữ liệu được mã hóa base64, cách tốt nhất duy nhất để cung cấp siêu dữ liệu của hình ảnh là sử dụng đánh dấu của Schema.org, trong đó có thể đàm phán dữ liệu EXIF, ví dụ như với điều này loại đánh dấu.
Một loại đánh dấu đầy hứa hẹn khác để đàm phán dữ liệu trông giống như "property: value", giống như EXIF, hiện tại có trạng thái đề xuất. Nhưng bài viết này từ blog của Google cho thấy các đoạn có cấu trúc, có thể được tạo bởi đề xuất đánh dấu tôi đã liên kết ở trên.