Tóm lại, HTML sẽ dựa trên một ngôn ngữ đánh dấu không liên kết khác có tên là SGML thường được sử dụng cho tài liệu và hướng dẫn sử dụng và những thứ tương tự.
Từ một bài viết về lịch sử của HTML:
Tim đã đề cập rằng một số tài liệu HTML ban đầu dựa trên ngôn ngữ SGML cũ mà CERN đã sử dụng: - Chúng tôi đã đưa vào HTML một số thẻ từ bộ thẻ SGML được sử dụng tại và từng được hỗ trợ tại CERN [...] Trình phân tích cú pháp HTML sẽ bỏ qua các thẻ mà nó không hiểu và sẽ bỏ qua các thuộc tính mà nó không hiểu về các thẻ CERN-SGML .
[...] hầu hết các thẻ HTML ban đầu thực sự được lấy từ ngôn ngữ CML SGMLGuid, bản thân nó là một biến thể của AAP (ngôn ngữ SGML ban đầu). Ví dụ, tiêu đề, hn, p, ol, v.v ... tất cả đều được lấy từ ngôn ngữ này. Sự thay đổi căn bản duy nhất là việc bổ sung tất cả các liên kết neo () quan trọng mà WWW sẽ không thực hiện.
Về cơ bản, đã lưu ý đến phần tôi đã in đậm, họ đã triển khai một tập hợp con các thẻ có sẵn trong hệ thống SGML mà họ quen thuộc, thêm thẻ <a> neo mới và chọn bỏ qua bất kỳ thẻ nào trong số nhiều thẻ họ đã không ' Không quan tâm hoặc muốn hỗ trợ cho lý do wahtever (chẳng hạn như thẻ cho danh sách thư mục, xmp cho thẻ "ví dụ", "hộp" để vẽ một hộp xung quanh một khối văn bản, v.v.). Vì vậy, cách đơn giản nhất để làm điều đó là tha thứ cho đánh dấu mà trình phân tích cú pháp không biết và bỏ qua đánh dấu không xác định tốt nhất có thể, bất kể nguyên nhân là do người dùng nhập đánh dấu xấu hay cách nhanh nhất dễ dàng nhất để chuyển đổi tài liệu hiện có sang định dạng HTML mới này là để thêm một số siêu liên kết vào các tài liệu SGML hiện có và bỏ qua mọi thẻ không được hỗ trợ hoặc triển khai.