Tôi đang làm việc trên một trang web sẽ cung cấp nội dung được bản địa hóa theo language+region
cách tiếp cận như được mô tả trên trang W3.org này (ví dụ: fr-CA
đối với nội dung tiếng Pháp của Canada và fr-FR
cho nội dung "Tiếng Pháp của Pháp"). Khi chúng tôi coi nội dung của mỗi nội dung language+region
là duy nhất, điều quan trọng đối với chúng tôi là các công cụ tìm kiếm xác định đúng và phục vụ nội dung phù hợp.
Bằng cách tìm kiếm trên Internet (ví dụ câu hỏi này ), có vẻ như hầu hết mọi người khuyên bạn nên sử dụng mã ngôn ngữ ISO639 trong lang
thuộc tính HTML để mô tả ngôn ngữ nội dung. Theo khuyến nghị này, chúng tôi sẽ sử dụng <html lang="fr">
để không cho phép phân biệt giữa các language+region
kết hợp đã nói ở trên .
Khi xem xét đặc tả HTML4 , có vẻ như sử dụng language+region
làm mã ngôn ngữ sẽ hoàn toàn ổn, vì en-US
ví dụ được đưa ra là một giá trị có thể. Tuy nhiên, tôi không thể tìm thấy bất kỳ xác nhận nào về điều này trong đặc tả HTML5 dường như không cung cấp bất kỳ ví dụ nào về các giá trị được phép có thể.
Từ đó tôi đã cố gắng để có được một câu trả lời thực tế bằng cách nhìn vào những gì những người khổng lồ web đang làm. Tôi đã xem những gì Facebook đang làm: họ cung cấp các phiên bản trang web tiếng Pháp và tiếng Pháp của Candian với các nội dung (hơi) khác nhau, trong khi lang
giá trị HTML vẫn giữ nguyên:
URL fr-CA : http://fr-ca.facebook.com
Thuộc tính lang HTML: <html lang="fr">
bản dịch của từ 'email':courriel
URL fr-FR : http://fr-fr.facebook.com/
HTML lang thuộc tính: <html lang="fr">
bản dịch của từ 'email':Adresse électronique
Cách mô tả / tiêu chuẩn để mô tả nội dung được bản địa hóa bằng cách sử dụng language+region
phương pháp tiếp cận trong HTML5 là gì?