Tôi đang làm việc trên một trang web sẽ cung cấp nội dung được bản địa hóa theo language+regioncách tiếp cận như được mô tả trên trang W3.org này (ví dụ: fr-CAđối với nội dung tiếng Pháp của Canada và fr-FRcho nội dung "Tiếng Pháp của Pháp"). Khi chúng tôi coi nội dung của mỗi nội dung language+regionlà duy nhất, điều quan trọng đối với chúng tôi là các công cụ tìm kiếm xác định đúng và phục vụ nội dung phù hợp.
Bằng cách tìm kiếm trên Internet (ví dụ câu hỏi này ), có vẻ như hầu hết mọi người khuyên bạn nên sử dụng mã ngôn ngữ ISO639 trong langthuộc tính HTML để mô tả ngôn ngữ nội dung. Theo khuyến nghị này, chúng tôi sẽ sử dụng <html lang="fr">để không cho phép phân biệt giữa các language+regionkết hợp đã nói ở trên .
Khi xem xét đặc tả HTML4 , có vẻ như sử dụng language+regionlàm mã ngôn ngữ sẽ hoàn toàn ổn, vì en-USví dụ được đưa ra là một giá trị có thể. Tuy nhiên, tôi không thể tìm thấy bất kỳ xác nhận nào về điều này trong đặc tả HTML5 dường như không cung cấp bất kỳ ví dụ nào về các giá trị được phép có thể.
Từ đó tôi đã cố gắng để có được một câu trả lời thực tế bằng cách nhìn vào những gì những người khổng lồ web đang làm. Tôi đã xem những gì Facebook đang làm: họ cung cấp các phiên bản trang web tiếng Pháp và tiếng Pháp của Candian với các nội dung (hơi) khác nhau, trong khi langgiá trị HTML vẫn giữ nguyên:
URL fr-CA : http://fr-ca.facebook.com
Thuộc tính lang HTML: <html lang="fr">
bản dịch của từ 'email':courriel
URL fr-FR : http://fr-fr.facebook.com/
HTML lang thuộc tính: <html lang="fr">
bản dịch của từ 'email':Adresse électronique
Cách mô tả / tiêu chuẩn để mô tả nội dung được bản địa hóa bằng cách sử dụng language+regionphương pháp tiếp cận trong HTML5 là gì?