Ảnh hưởng của chữ ghép trong web, liên quan đến SEO


19

Tất cả các nhà thiết kế yêu thích chữ ghép nhưng kiểu chữ vanilla web chỉ là hút. Tôi nghe nói về những người thông minh giải quyết được nhiều vấn đề, mang đến những trích dẫn gợi cảm, những ký hiệu tuyệt đẹp và tất cả. Nó chỉ hoàn hảo, trực quan.

Nhưng tôi lo lắng về SEO. Hãy nói trên một trang web, từ này finallytrở thành finally. Các công cụ tìm kiếm có khả năng lập chỉ mục từ đó và trả lại trang khi tìm kiếm finally(không có chữ ghép) không?

Câu trả lời:


3

Tóm lược

Nếu máy chủ của bạn xử lý các trang có chữ ghép (như smartypants), công cụ tìm kiếm không nhất quán. Bing hiện không lập chỉ mục đúng. Tôi nói chung, nó yêu cầu rắc rối. Vì các công cụ tìm kiếm thay đổi, nên có một phương pháp bên dưới mà bạn có thể sử dụng để kiểm tra cách các công cụ tìm kiếm bạn quan tâm đến chữ số chỉ mục .

Nếu máy chủ của bạn xử lý các trang có văn bản thông thường, thì Javascript sẽ biến chúng thành chữ viết tắt, điều đó tốt . Các công cụ tìm kiếm không áp dụng thay đổi nội dung Javascript trước khi lập chỉ mục các trang (mặc dù tuyên bố rằng có một vài trường hợp ngoại lệ như tải bình luận Facebook ). Vì có một phương pháp tiêu chuẩn công nghiệp để cung cấp cho công cụ tìm kiếm nội dung động và phương pháp này được Google chứng thực , nên sẽ rất bất ngờ nếu điều này thay đổi trong tương lai. Google khuyên bạn nên duyệt trang web của mình bằng trình duyệt văn bản thuần túy (ví dụ: họ đề xuất Lynx ) để xem nội dung của bạn như thế nào công cụ tìm kiếm nhìn thấy nó.


Chi tiết hơn về trường hợp đầu tiên (các trang được viết bằng chữ in trong mã) ...


Về lý thuyết

... nó không nên tạo ra bất kỳ sự khác biệt nào đối với công cụ tìm kiếm được thiết lập tốt.

Đầu tiên, nó giúp hiểu được sự khác biệt giữa glyphs và ký tự . Một chữ ghép là một glyph đại diện cho hai ký tự f i. Phần mềm xử lý phần mềm như thế nào tùy thuộc vào phần mềm đó và tùy thuộc vào ngữ cảnh và nhiệm vụ trong tay - bạn sẽ thấy từ các ví dụ trong câu hỏi được liên kết đó khi bạn sao chép và dán glyphs, những gì được dán sẽ thay đổi: đôi khi glyph được dán, đôi khi glyph được coi là các ký tự liên quan của nó fiđược dán.

Bất kỳ bộ xử lý văn bản tự động được làm tốt nào quan tâm đến ngữ nghĩa văn bản (công cụ tìm kiếm, kiểm tra chính tả, trình đọc màn hình ...) nên coi glyph là giống hệt với các ký tự mà nó đại diện và nên coi finallylà giống hệt nhau finally, bởi vì đó là văn bản ý nghĩa của glyph.

Trong thực tế

Không phải mọi thứ đều được làm tốt ...

Đây là một cách dễ dàng để kiểm tra công cụ tìm kiếm. Đây là một dòng văn bản từ câu hỏi khác:

Copy the ligature fi from Illustrator to this input box

Nếu chúng ta lấy phiên bản không chữ viết của câu đó và tìm kiếm trên đó trong dấu ngoặc kép:

(tìm kiếm trên "Copy the ligature fi from Illustrator to this input box"):

  1. ... nếu một công cụ tìm kiếm coi glyphs ligature là khớp với các ký tự mà chúng đại diện, nó sẽ tìm thấy trang đó (và, khi nó được lập chỉ mục, trang này)
  2. ... Nếu một công cụ tìm kiếm coi glyphs ligature khác với các ký tự mà chúng đại diện, nó sẽ không tìm thấy gì cho đến khi trang này được lập chỉ mục, sau đó, nó sẽ chỉ tìm thấy trang này và các tìm kiếm với phiên bản ligature sẽ tìm thấy trang đó.
  3. ... Nếu một công cụ tìm kiếm hoảng hốt khi nhìn thấy glyphs như chữ ghép hoàn toàn, nó sẽ không tìm thấy gì, ngay cả trang này và các tìm kiếm với phiên bản chữ ghép cũng sẽ không tìm thấy gì

Một số kết quả nhanh chóng cho 5 công cụ tìm kiếm hàng đầu thế giới (liên kết là kết quả tìm kiếm):

  • Google: Tốt (loại 1) . (mặc dù bình luận bên dưới, nó vẫn ổn với cả định dạng thực thể unicode hoặc HTML)
  • Bing: Thất bại ( loại 2 ).
  • Yahoo: Fail ( loại 2 ) (hóa ra Yahoo là "Powered by Bing")
  • Yandex (tiếng Nga): Tốt (loại 1)
  • Các trang của Baidu (Trung Quốc): erm, không có trang webdesdesign.stackexchange.com dường như xuất hiện trong các tìm kiếm của Baidu ... có lẽ chúng tôi bị cấm ở đó ...?!

Tôi chỉ cần chỉnh sửa câu trả lời của mình, kiểm tra mã nguồn trên liên kết đó. Tất cả unicode của nó như & # xfb00; Thuật toán của Google bỏ qua.
Ryan

Trên thực tế google không khớp với những thứ đó: hãy nhìn vào những gì nó nổi bật ở đây (chữ ghép)ở đây (văn bản thuần túy) - cả hai đều khớp với nhau. Nhưng tôi đồng ý với lời khuyên của bạn ...
user56reinstatemonica8

... (những URL đó rất lớn, cần 2 bình luận), có vẻ như nó gây rắc rối. Nếu bing không khớp với chữ ghép, các dịch vụ quan trọng khác cũng sẽ không.
user56reinstatemonica8

Nhìn vào URL của liên kết đầu tiên và mã nguồn phù hợp: bạn sẽ thấy Google không (hiện tại ...) có vấn đề với định dạng unicode và nó lập chỉ mục các chữ cái unicode, chữ ghép thực thể HTML và các cặp ký tự riêng biệt thông thường giống f inhư tương đương mà không có bất kỳ vấn đề. Google dường như đối phó tốt - nhưng, sự không nhất quán giữa các công cụ tìm kiếm khác nhau (ít nhất là trong cuốn sách của tôi) là một công cụ giải quyết.
user56reinstatemonica8

3

Dựa trên một ví dụ trực tiếp tôi thấy tôi sẽ cực kỳ quan tâm đến việc sử dụng rộng rãi điều này bởi vì nó sẽ ảnh hưởng đến SEO. Các ký tự đặc biệt được phân tích cú pháp dưới dạng Unicode, do đó thuật toán của Google sẽ không đọc nó. Nó sẽ ổn cho việc sử dụng tiết kiệm nhưng tôi sẽ không phát điên với nó hoặc sử dụng nó vào bất cứ thứ gì quan trọng như tiêu đề.

Đây là liên kết đến ví dụ trực tiếp mà tôi đã xem: http://pages.cs.wisc.edu/~wolfson/ligatures.html


Tôi không nghĩ chúng sẽ là những chữ cái trong mã nguồn. Có vẻ như smartypants là một thứ phía máy chủ phân tích cú pháp đầu vào và lưu glyphs vào văn bản được lưu trữ trong cơ sở dữ liệu và do đó cũng là mã nguồn. Điều đó nói rằng, tôi nghĩ rằng nó sẽ tốt cho seo nào.
user56reinstatemonica8

Ah thực sự tôi đã kiểm tra phần tử nhưng không thực sự xem nguồn. Tôi sẽ chỉnh sửa câu trả lời của tôi.
Ryan

1
Tôi chắc chắn đồng ý với "cực kỳ quan tâm", hỗ trợ unicode nổi tiếng là không nhất quán. Nhưng đối với bản ghi, google có thể (hiện tại ...) lập chỉ mục unicode và (hiện tại ...) khớp với các chữ ghép unicode trên trang đó với các tìm kiếm, l i f iv.v. (xem cách in đậm chúng trong bản xem trước). Nhưng tôi chắc chắn sẽ không bao giờ muốn dựa vào nó ...
user56reinstatemonica8

Điều gì xảy ra nếu chữ ghép được đặt qua javascript? Nó sẽ không thay đổi tài liệu html, do đó hoàn toàn vô hình đối với các công cụ tìm kiếm? Đó sẽ là một giải pháp?
TKrugg

Vâng, điều đó sẽ ổn thôi - các công cụ tìm kiếm thường lập chỉ mục tài liệu gốc mà không áp dụng javascript. Có lẽ bạn muốn kiểm tra xem nó làm như vậy không làm chậm đáng kể thời gian tải trang và rằng sẽ không có một cú giật mạnh cho người xem khi các ký tự vanilla được thay thế bằng chữ ghép trong khi tải trang.
user56reinstatemonica8
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.