Một lý do khác để đi với cái ngắn là nó phù hợp với các trường hợp khác mà bạn có thể chỉ định một bộ ký tự được đánh dấu. Ví dụ:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
Tính nhất quán giúp giảm lỗi và làm cho mã dễ đọc hơn.
Lưu ý rằng thuộc tính bộ ký tự không phân biệt chữ hoa chữ thường. Bạn có thể sử dụng UTF-8 hoặc utf-8, tuy nhiên UTF-8 rõ ràng hơn, dễ đọc hơn, chính xác hơn.
Ngoài ra, hoàn toàn không có lý do nào để sử dụng bất kỳ giá trị nào ngoài UTF-8 trong thuộc tính bộ ký tự meta hoặc tiêu đề trang. UTF-8 là mã hóa mặc định cho các tài liệu Web kể từ HTML4 năm 1999 và là cách thực tế duy nhất để tạo các trang Web hiện đại.
Ngoài ra, bạn không nên sử dụng các thực thể HTML trong UTF-8. Các ký tự như biểu tượng bản quyền nên được gõ trực tiếp. Các thực thể duy nhất bạn nên sử dụng là cho 5 ký tự đánh dấu dành riêng: ít hơn, lớn hơn, ký hiệu, số nguyên tố, số nguyên tố kép. Các thực thể cần một trình phân tích cú pháp HTML, mà bạn không phải lúc nào cũng muốn sử dụng, chúng sẽ đưa ra các lỗi, làm cho mã của bạn ít đọc hơn, tăng kích thước tệp của bạn và đôi khi giải mã không chính xác trong các trình duyệt khác nhau tùy thuộc vào các thực thể bạn sử dụng. Tìm hiểu cách nhập / chèn bản quyền, nhãn hiệu, trích dẫn mở, trích dẫn đóng, dấu nháy đơn, dấu gạch ngang, dấu gạch ngang, dấu đầu dòng, Euro và bất kỳ ký tự nào khác bạn gặp trong nội dung của mình và sử dụng các ký tự thực tế đó trong mã của bạn. Mac có Trình xem ký tự mà bạn có thể bật trong Tùy chọn hệ thống bàn phím, và bạn có thể tìm và sau đó kéo và thả các ký tự bạn cần hoặc sử dụng Trình xem bàn phím phù hợp để xem phím nào cần nhập. Ví dụ: nhãn hiệu là Tùy chọn + 2. UTF-8 chứa tất cả các ký tự và ký hiệu từ mọi ngôn ngữ viết của con người. Vì vậy, không có lý do gì để sử dụng - thay vì một dấu gạch ngang. Cũng không phải là một ý tưởng tồi để tìm hiểu các quy tắc về dấu câu và kiểu chữ cũng ... ví dụ, biết rằng một khoảng thời gian nằm trong một trích dẫn chặt chẽ, không phải bên ngoài.
Sử dụng thẻ cho một cái gì đó như kiểu nội dung và mã hóa là rất mỉa mai, vì không biết những điều đó, bạn không thể phân tích tệp để nhận giá trị của thẻ meta.
Không, đó là không đúng sự thật. Trình duyệt bắt đầu phân tích tệp dưới dạng mã hóa mặc định của trình duyệt, UTF-8 hoặc ISO-8859-1. Vì US-ASCII là tập hợp con của cả ISO-8859-1 và UTF-8, trình duyệt có thể đọc tốt cả hai cách ... nó đều giống nhau. Khi trình duyệt gặp thẻ bộ ký tự meta, nếu mã hóa khác với trình duyệt đang sử dụng, trình duyệt sẽ tải lại trang trong mã hóa được chỉ định. Đó là lý do tại sao chúng tôi đặt thẻ bộ ký tự meta ở trên cùng, ngay sau thẻ đầu, trước mọi thứ khác, ngay cả tiêu đề. Bằng cách đó bạn có thể sử dụng các ký tự UTF-8 trong tiêu đề của mình.
Bạn phải lưu (các) tệp của mình ở dạng mã UTF-8 mà không cần BOM
Điều đó không hoàn toàn đúng. Nếu bạn chỉ có các ký tự US-ASCII trong tài liệu của mình, bạn có thể Lưu nó dưới dạng US-ASCII và phục vụ dưới dạng UTF-8, vì đây là tập hợp con. Nhưng nếu có các ký tự Unicode, bạn đã đúng, bạn phải Lưu dưới dạng UTF-8 mà không cần BOM.
Nếu bạn muốn một trình soạn thảo văn bản tốt sẽ lưu các tệp của bạn trong UTF-8, tôi khuyên bạn nên dùng Notepad ++.
Trên Mac, sử dụng Bare Bones TextWrangler (miễn phí) từ Mac App Store hoặc Bare Bones BBEdit có tại Mac App Store với giá 39,99 đô la ... rất rẻ cho một công cụ tuyệt vời như vậy. Trong một trong hai ứng dụng, có một menu ở dưới cùng của cửa sổ tài liệu nơi bạn chỉ định mã hóa tài liệu và bạn có thể dễ dàng chọn "UTF-8 no BOM". Và tất nhiên bạn có thể đặt nó làm mặc định cho các tài liệu mới trong Tùy chọn.
Nhưng nếu Máy chủ web của bạn phục vụ mã hóa trong tiêu đề HTTP, được khuyến nghị, cả hai [thẻ meta] đều không cần thiết.
Điều đó là không chính xác. Tất nhiên bạn nên đặt mã hóa trong tiêu đề HTTP, nhưng bạn cũng nên đặt nó trong thuộc tính bộ ký tự meta để người dùng có thể lưu trang, ra khỏi trình duyệt vào bộ nhớ cục bộ và sau đó mở lại sau dấu hiệu duy nhất của mã hóa sẽ có mặt là thuộc tính bộ ký tự meta. Bạn cũng nên đặt thẻ cơ sở cho cùng một lý do ... trên máy chủ, thẻ cơ sở là không cần thiết, nhưng khi được mở từ bộ nhớ cục bộ, thẻ cơ sở cho phép trang hoạt động như thể trên máy chủ, với tất cả tài sản tại chỗ và như vậy, không có liên kết bị hỏng.
AddDefaultCharset UTF-8
Hoặc bạn chỉ có thể thay đổi mã hóa các loại tệp cụ thể như vậy:
AddType text/html;charset=utf-8 html
Mẹo để phục vụ cả hai tệp UTF-8 và Latin-1 (ISO-8859-1) là cung cấp cho các tệp UTF-8 một phần mở rộng "văn bản" và các tệp Latin-1 "txt."
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Cuối cùng, hãy xem xét Lưu tài liệu của bạn bằng các kết thúc dòng Unix, chứ không phải các kết thúc dòng Mac cũ (cổ điển), điều này không giúp ích và có thể làm tổn thương, đặc biệt là xuống dòng khi chúng tôi càng ngày càng xa các hệ thống cũ. Một tài liệu HTML với mã hóa HTML5, UTF-8 hợp lệ và các kết thúc dòng Unix là một công việc được thực hiện tốt. Bạn có thể chia sẻ và chỉnh sửa và lưu trữ và đọc và khôi phục và dựa vào tài liệu đó trong nhiều ngữ cảnh. Đó là ngôn ngữ chung. Đó là giấy kỹ thuật số.