Hình ảnh được mã hóa Base64 và tính khả dụng của siêu dữ liệu của họ cho Googlebot


9

Nếu tôi nhúng hình ảnh vào một trang dưới dạng img- srcvới URI dữ liệu cơ sở64, liệu siêu dữ liệu của hình ảnh (EXIF, IPTC, XMP) có còn khả dụng cho imagebot của Google không?


1
Chắc là không. Googlebot có thể cần một URL mà nó có thể xếp hạng và giới thiệu người dùng.
John Conde

1
Quên dữ liệu EXIF, tôi thậm chí không chắc chắn rằng hình ảnh của Google thậm chí sẽ lập chỉ mục một hình ảnh không có URL riêng.
Stephen Ostermiller

@StephenOstermiller: đó là câu hỏi: nếu nó lập chỉ mục những hình ảnh như vậy, thì nó cũng đọc EXIF
Evgeniy

@Evgeniy Như Stephen chỉ ra, các URI dữ liệu không tách rời khỏi tài liệu chứa của chúng (xem phần này để biết thêm). Các công cụ tìm kiếm lập chỉ mục URL, do đó, chỉ có tài liệu chứa mới được lập chỉ mục và liệu chúng có lập chỉ mục siêu dữ liệu có trong URI dữ liệu hay không (nếu thực sự nó cũng chứa nó, làm cho nó thậm chí còn lớn hơn) là một điểm câm. Để xác nhận, bạn có thể sử dụng công cụ tìm kiếm mã nguồn để tìm URI dữ liệu và sau đó xem hình ảnh đó có được lập chỉ mục và chứa thông tin EXIF ​​trong Google không. Điều đó dường như rất khó khả thi mặc dù.
dan

@Evgeniy Lưu ý rằng việc đăng chéo cùng một câu hỏi lên nhiều trang web Stack Exchange không bị hủy bỏ.
dan

Câu trả lời:


6

Google không lập chỉ mục hình ảnh URI dữ liệu cho tìm kiếm hình ảnh của Google. John Mueller của Google nói như vậy ở đây và trong các bình luận bên dưới. Vì hình ảnh URI dữ liệu không được lập chỉ mục trong tìm kiếm hình ảnh của Google, dữ liệu EXIF ​​trong đó không liên quan.

Bạn có thể xác minh rằng những hình ảnh này không được lập chỉ mục. Tôi đã tìm kiếm hình ảnh của Google cho "dữ liệu uri" và kiểm tra kết quả. Tất cả các hình ảnh tôi đã xem là các tệp hình ảnh, không phải URI hình ảnh được mã hóa base64. Bạn sẽ nghĩ rằng nếu Google có thể lập chỉ mục hình ảnh URI dữ liệu, một số trong số chúng sẽ hiển thị trong kết quả tìm kiếm cho cụm từ đó.

Nếu Google không bao giờ quyết định lập chỉ mục hình ảnh URI dữ liệu, họ sẽ có thể nhận được dữ liệu EXIF ​​từ họ. Dữ liệu uri là toàn bộ tệp base64 được mã hóa (không có khoảng trắng hoặc dòng mới) với data:image/png;base64,tiền tố. Mọi dữ liệu meta trong tệp sẽ vẫn có trong phiên bản URI dữ liệu được mã hóa base64.

Tôi sử dụng hình ảnh URI dữ liệu trên một trong các trang web của mình. Tôi làm như vậy bởi vì người dùng thường chỉ xem một trang trên trang web để có được tất cả thông tin họ cần. Bao gồm tất cả CSS, JS và dữ liệu hình ảnh nội tuyến trong trang sẽ cải thiện hiệu suất đáng kể. Các hình ảnh đều nhỏ, vì vậy kỹ thuật hoạt động đặc biệt tốt.

Trang web của tôi nhận được một lượng lưu lượng truy cập khá lớn từ Internet Explorer 7 và trước đó không hỗ trợ hình ảnh URI dữ liệu. Vì vậy tôi phải phục vụ họ một cách có điều kiện. Tôi cũng có hình ảnh trên máy chủ và tôi chọn URL hình ảnh thông thường hoặc URI dữ liệu dựa trên User-Agenttiêu đề. Tôi coi các bot (bao gồm Googlebot) giống như IE 7, tức là tôi phục vụ hình ảnh dưới dạng URL HTTP. Tôi làm điều này bởi vì bao gồm hình ảnh uri dữ liệu làm tăng đáng kể kích thước trang. Hầu hết các bot không cần tải xuống hình ảnh, vì vậy nó hiệu quả hơn đối với chúng. Tôi cũng đã nhận thấy rằng Google Webmaster Tools đã báo cáo Googlebot đang thu thập dữ liệu trang web của tôi chậm hơn nhiều với hình ảnh URI dữ liệu được bật cho nó. Điều này về mặt kỹ thuật có thể được coi là che giấu, nhưng nó sẽ là một cách để lấy hình ảnh URI dữ liệu của bạn được lập chỉ mục.


2
Ví dụ đầu tiên của bạn được lập chỉ mục tại URL này: photos.topicshow.com/ và lần thứ hai của bạn tại đây: hình ảnh5.fanpop.com / image / photos / 30600000 / Lỗi Trong tất cả các trường hợp tôi có thể tìm thấy, có một URL http cho hình ảnh cũng.
Stephen Ostermiller

1
Chuỗi được mã hóa @StephenOstermiller có thể chứa không gian nội dung: goo.gl/RF8r07 . tôi sẽ điền một hình ảnh với EXIF, mã hóa nó, xuất bản và xem, cho dù nó có thành chỉ mục hay không.
Evgeniy

3
John Mueller (từ Google) cho thấy đây rằng Google thường không ảnh chỉ số từ URI dữ liệu. Nhiều công cụ trực tuyến được sử dụng để mã hóa các siêu dữ liệu này cũng sẽ loại bỏ siêu dữ liệu, do đó, nó thực sự phụ thuộc vào cách mã hóa thông tin EXIF ​​có được duy trì hay không ... nhưng dù sao chúng không được lập chỉ mục, đó là một điểm cần thiết. Cho chúng tôi biết kết quả của bạn (đảm bảo không để URL cho hình ảnh được lập chỉ mục - Google cũng sử dụng nhận dạng hình ảnh để thông tin EXIF ​​có thể được sử dụng từ hình ảnh phù hợp).
dan

1
@dan cảm ơn bạn! liên kết của bạn đến John Mueller trả lời xóa nhiều thứ ngay bây giờ! Nếu G không lập chỉ mục hình ảnh, nơi nó không thể có URI, do đó, người ta không cần phải xem xét liệu EXIF ​​có còn bên trong hay không.
Evgeniy

3
Như đã liên kết ở trên, chúng tôi hiện không lập chỉ mục những hình ảnh này dưới dạng hình ảnh riêng biệt. Điều đó có thể thay đổi trong tương lai, nhưng ít nhất là tại thời điểm bạn muốn sử dụng các URL hình ảnh riêng biệt nếu bạn muốn những hình ảnh đó được lập chỉ mục trong Tìm kiếm hình ảnh.
John Mueller

2

Mặc dù Google sử dụng hình ảnh dưới dạng URI dữ liệu được mã hóa base64 trên SERP của riêng mình, nhưng Google không lập chỉ mục các hình ảnh đó trên các trang web khác. Cảm ơn @dan, người đã chỉ cho tôi cuộc thảo luận về Google Groups, nơi John Mueller giải thích vấn đề này . Điều đó cũng có nghĩa là câu hỏi về sự tồn tại của dữ liệu EXIF ​​trong các hình ảnh đó không liên quan.

Giải thích này cho thấy rõ, hình ảnh nào là kỹ thuật tối ưu hóa hiệu suất này tốt hơn để áp dụng: hình ảnh nhỏ, như biểu tượng, favicon và nút và những hình ảnh đó, không cung cấp bất kỳ giá trị bổ sung nào cho nội dung của trang web.

Trên trang khác, nếu một người phân loại phải nhúng hình ảnh VỚI giá trị nội dung bổ sung dưới dạng URI dữ liệu được mã hóa base64, cách tốt nhất duy nhất để cung cấp siêu dữ liệu của hình ảnh là sử dụng đánh dấu của Schema.org, trong đó có thể đàm phán dữ liệu EXIF, ví dụ như với điều này loại đánh dấu.

Một loại đánh dấu đầy hứa hẹn khác để đàm phán dữ liệu trông giống như "property: value", giống như EXIF, hiện tại có trạng thái đề xuất. Nhưng bài viết này từ blog của Google cho thấy các đoạn có cấu trúc, có thể được tạo bởi đề xuất đánh dấu tôi đã liên kết ở trên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.