Tôi đã thấy câu hỏi này trên đề xuất trang web typography và nó đã nói với tôi rằng tôi không biết câu trả lời. Tôi luôn coi 'glyph' và 'character' là có thể hoán đổi cho nhau.
Sau khi đọc một lời giải thích trên trang Mô hình mã hóa ký tự Unicode , sự hiểu biết của tôi đại khái là thế này:
- Các ký tự được xác định bởi ý nghĩa của chúng trong ngôn ngữ, glyphs, bởi sự xuất hiện của chúng . Vì vậy, dây chằng để kết hợp thẩm mỹ
fi
là một glyph, nhưng hai ký tự.
Vì vậy, niềm tin của tôi là (xin hãy sửa cho tôi nếu tôi sai) rằng sự khác biệt thực tế sẽ là:
- Trình phân tích cú pháp văn bản không quan tâm đến tính thẩm mỹ của văn bản sẽ đọc glyphs dưới dạng ký tự tương ứng của chúng. Vì thế:
- Nếu bạn đã sao chép và dán văn bản có chứa glyphs vào trình soạn thảo văn bản thuần túy, glyphs sẽ được chuyển đổi thành các ký tự tương ứng của chúng (một
fi
glyph ligature sẽ trở thànhf
vài
) - Bất kỳ hệ thống tự động được làm tốt nào dựa trên phân tích cú pháp văn bản (ví dụ: trình thu thập công cụ tìm kiếm, trình đọc màn hình, trình kiểm tra chính tả) sẽ diễn giải các glyph như các ký tự tương ứng của chúng.
- Một nhân vật có thể có nhiều bộ glyph hoặc glyph. Tôi muốn nói rằng một glyph chỉ có thể có một ký tự, nhưng điều này rõ ràng không đúng vì có một ví dụ trên bài viết được liên kết của 3 bộ glyph và glyph dường như mỗi ký tự tương ứng với một ký tự và bộ ký tự. Tôi hoàn toàn không thấy làm thế nào điều này có thể hoạt động: chắc chắn điều đó có nghĩa là sẽ có sự không nhất quán hoặc mơ hồ trong cách các glyphs được diễn giải, thay đổi bởi người phiên dịch? (hoặc nó thay đổi theo ngôn ngữ hoặc theo phông chữ?)
- Trong khi các trình duyệt glyph (ví dụ như trình duyệt trong Illustrator) chứa tập hợp glyph đầy đủ của phông chữ, bản đồ ký tự (ví dụ: bản đồ ký tự Windows) chỉ chứa các ký tự, không phải là glyph có nhiều ký tự như chữ ghép (điều mà trước đây tôi không nhận thấy)
- Nếu bạn đã sao chép và dán văn bản có chứa glyphs vào trình soạn thảo văn bản thuần túy, glyphs sẽ được chuyển đổi thành các ký tự tương ứng của chúng (một
Tôi cảm thấy như mình đang ở gần đó nhưng rõ ràng tôi đã hiểu nhầm một điều gì đó dọc theo dòng: không chỉ là điều "Một glyph nhiều ký tự", mà còn, sao chép và dán hành vi với chữ ghép không hoàn toàn như tôi mong đợi:
- Sao chép chữ ghép
fi
từ Illustrator vào hộp nhập này: dán dưới dạngfi
(hai ký tự) như mong đợi. - Dán mã HTML cho nó (
fi
) - hiển thị dưới dạng chữ ghép khi không nằm trong khối mã (- trong phông chữ này trông không giống chữ ghép, nhưng bạn sẽ thấy là một nếu bạn cố gắng chọn chỉ một nửa của nó) và mã khi ở trong khối mã (fi
), như mong đợi. - Sao chép và dán lại dây chằng không mã khối được kết xuất lại vào hộp nhập: dán dưới dạng ký tự chữ ghép và hiển thị dưới dạng chữ ghép bất kể nó có trong khối mã hay không (fi và
fi
). Các từ tương tự có chứa nó: mis t mis fi ts (fit misfits
) dán dưới dạng mis t mis fi ts (fit misfits
). Có lẽ nó phụ thuộc vào việc nơi nó được dán có hiểu mã hóa được sử dụng không?
Sự hiểu biết của tôi về điều này đến mức nào? Ai đó có thể cho tôi đúng: nêu một định nghĩa rõ ràng về sự khác biệt giữa glyphs và các ký tự (nếu tôi sai hoặc có thể được cải thiện), và đưa ra các ví dụ rõ ràng / chính xác hơn so với ý nghĩa của tôi trong thực tế ?