OK, hãy tách câu hỏi của các nhân vật rằng:
- hoàn toàn không hợp lệ trong bất kỳ tài liệu XML nào.
- cần phải được trốn thoát
Câu trả lời được cung cấp bởi @dolmen trong " Các ký tự không hợp lệ trong XML " vẫn hợp lệ nhưng cần được cập nhật với đặc tả XML 1.1.
1. Ký tự không hợp lệ
Các ký tự được mô tả ở đây là tất cả các ký tự được phép chèn vào tài liệu XML.
1.1. Trong XML 1.0
Danh sách toàn cầu của các ký tự được phép là:
[2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */
Về cơ bản, các ký tự điều khiển và ký tự trong phạm vi Unicode không được phép. Điều này cũng có nghĩa là việc gọi ví dụ thực thể nhân vật 
bị cấm.
1.2. Trong XML 1.1
Danh sách toàn cầu của các ký tự được phép là:
[2] Char ::= [#x1-#xD7FF] | [#xE000-#xFFFD] | [#x10000-#x10FFFF] /* any Unicode character, excluding the surrogate blocks, FFFE, and FFFF. */
[2a] RestrictedChar ::= [#x1-#x8] | [#xB-#xC] | [#xE-#x1F] | [#x7F-#x84] | [#x86-#x9F]
Bản sửa đổi khuyến nghị XML này đã mở rộng các ký tự được phép để các ký tự điều khiển được phép và tính đến một bản sửa đổi mới của tiêu chuẩn Unicode, nhưng những ký tự này vẫn không được phép: NUL (x00) , xFFFE , xFFFF ...
Tuy nhiên, việc sử dụng các ký tự điều khiển và ký tự Unicode không xác định là không được khuyến khích.
Cũng có thể nhận thấy rằng tất cả các trình phân tích cú pháp không phải lúc nào cũng tính đến điều này và các tài liệu XML có các ký tự điều khiển có thể bị từ chối.
2. Các ký tự cần được thoát (để có được một tài liệu được định dạng tốt):
Các <
phải được thoát ra với một <
tổ chức nào, kể từ khi nó được giả định là sự khởi đầu của một thẻ.
Các &
phải được thoát ra với một &
tổ chức nào, kể từ khi nó được giả định là bắt đầu một tham chiếu thực thể
Các >
được kết thúc bằng >
thực thể. Nó không bắt buộc - nó phụ thuộc vào bối cảnh - nhưng nó được khuyến khích để thoát khỏi nó.
Các '
được kết thúc bằng một '
thực thể - bắt buộc trong các thuộc tính được định nghĩa trong dấu nháy đơn nhưng nó được khuyên phải luôn luôn thoát khỏi nó.
Các "
được kết thúc bằng một "
thực thể - bắt buộc trong các thuộc tính được định nghĩa trong dấu ngoặc kép nhưng nó được khuyên phải luôn luôn thoát khỏi nó.