Lịch sử của những điều này có thể khai sáng cho bạn ở đây. Nói một cách đơn giản về siêu ngôn ngữ, hồ sơ, tập con và trường hợp là một chút khô khan! Tôi sẽ cố gắng giữ nó ngắn gọn và đơn giản.
SGML phát triển từ GML (Ngôn ngữ đánh dấu tổng quát) được 3 kỹ sư của IBM nghĩ ra vào những năm 1960 như là một phương tiện lưu trữ các tài liệu pháp lý, chính phủ, công nghiệp và quân sự phức tạp. GML dần dần được tinh chỉnh cho đến khi nó được chuẩn hóa thành SGML vào năm 1986.
GML / SGML không phải là một ngôn ngữ cho mỗi gia nhập . Nó đúng hơn là một ngôn ngữ meta , tức là một ngôn ngữ để xác định các ngôn ngữ tuân thủ hoặc "quy tắc" theo đó định dạng của một loạt các tài liệu phức tạp có thể được thiết kế theo cách nhìn chung nhất quán. Do đó, mỗi loại tài liệu khác nhau sẽ xác định bộ tên thẻ tuân thủ SGML của riêng nó cộng với các thuộc tính được liên kết, cũng như bất kỳ định danh / không gian tên công khai chính thức nào được xác định, v.v. loại liên quan. Do tính thống nhất giữa tất cả các tài liệu tuân thủ các quy tắc SGML, có thể viết mã để đối chiếu / xử lý dữ liệu trong các tài liệu này và chuyển dữ liệu giữa các tài liệu có chung định dạng.
SGML đã được tìm thấy quá công phu cho nhiều tài liệu có kích thước nhỏ hơn. Vì vậy, XML được phát triển từ năm 1996 đến 2006 dưới dạng tập hợp con ( cấu hình từ có nghĩa thực sự giống như tập hợp con) của SGML có thể xử lý cả tài liệu nhỏ và lớn. Là một tập hợp con của ngôn ngữ meta, XML tự nó là ngôn ngữ meta, mặc dù ngôn ngữ đơn giản hơn. Bạn có thể nói rằng XML cung cấp một cơ sở để thiết kế các định dạng tài liệu phù hợp cho cả việc lưu trữ và chuyển giao dễ dàng giữa các hệ thống trên mạng.
Sau khi chuẩn hóa SGML nhưng trước khi được đơn giản hóa thành XML, internet đã xuất hiện và với nhu cầu định dạng tài liệu cho phép dễ dàng chuyển và hiển thị cả tài liệu và dữ liệu lỏng lẻo. Kết quả là ngôn ngữ HTML, một ví dụ (đôi khi được gọi là ứng dụng ) của SGML với 18 thẻ được xác định trước cung cấp một cách tiêu chuẩn hóa để hiển thị nhiều loại dữ liệu, ví dụ như văn bản, hình ảnh, âm thanh, v.v. một số yếu tố để bỏ qua thẻ bắt đầu hoặc kết thúc. Các phiên bản tiếp theo của HTML đã thêm các thẻ và thuộc tính mới vào đó và khiến một số thẻ hiện có bị lỗi thời. Cho đến HTML 5, các thay đổi đối với HTML đã được thực hiện để nó luôn là ngôn ngữ con của SGML.
Sau khi XML được chuẩn hóa, một phiên bản của nó được gọi là XHTML đã xuất hiện kết hợp các tên thẻ HTML hiện có với sự nghiêm ngặt của XML về việc đóng thẻ, không gian tên, lược đồ, v.v. XHTML ban đầu hứa hẹn sẽ hữu ích cho việc lưu trữ, truyền và hiển thị dữ liệu. Nó dường như sắp thay thế HTML như một cách phổ biến nhất để hiển thị tài liệu web - cho đến khi HTML 5 xuất hiện. HTML 5 có một số tính năng cú pháp vượt xa các tính năng được xác định trong SGML để cung cấp hiển thị dữ liệu phong phú hơn, đặc biệt là cho các trang web đa phương tiện. Thời gian trôi qua, các tính năng bổ sung đã được thêm vào HTML 5 làm phong phú thêm việc sử dụng để hiển thị / sử dụng dữ liệu đến mức không thể thay thế bằng các phiên bản XHTML mới, ít nhất là về hiển thị dữ liệu. Mặc dù các tiêu chuẩn cho HTML & XHTML được thực hiện bởi các nhóm làm việc của W3C, việc truyền bá thực tế các ngôn ngữ "trên mặt đất" này được thực hiện bởi các nhà thiết kế web tiến bộ và không có tiến bộ nào hơn các ngôn ngữ làm việc trong lĩnh vực truyền thông (quảng cáo / PR / tiếp thị): chỉ cần nhìn vào sự sáng tạo của các trang web quảng cáo so với các trang web khác. Khu vực này thực sự đã sử dụng ngôn ngữ HTML 5 mới, rất vui khi khai thác khả năng của nó cho SVG, âm thanh, video vàcác API mới . Việc áp dụng HTML 5 sẵn sàng của họ đã nhanh chóng dẫn đến sự phổ biến của các nhà thiết kế web nói chung, một quá trình được tăng tốc nhờ trao đổi trực tuyến các kỹ năng và thủ thuật trên YouTube và các trang web khác. Một phiên bản XHTML được cập nhật, XHTML5, đã xuất hiện nhưng nó không thực sự là một dẫn xuất XML nghiêm ngặt mà là một phiên bản HTML5 được tuần tự hóa XML. Chỉ có một tỷ lệ nhỏ các trang web dường như có bất kỳ việc sử dụng cho nó.
Đó là câu chuyện đằng sau những ngôn ngữ dữ liệu này. Tôi hy vọng nó giúp bạn phân biệt ý nghĩa và mục đích của tất cả chúng. Về mặt triết học, câu chuyện này cho thấy một công cụ hỗ trợ thiết yếu (SGML) cho công nghệ mới (internet) có thể như thế nào, trong môi trường mới với nhu cầu ngày càng đa dạng, vượt xa các giới hạn ban đầu của nó nhưng trở nên đơn giản hơn về mặt khái niệm, linh hoạt hơn và mạnh mẽ hơn.