Rất nhiều công việc thực sự ban đầu đã được thực hiện với mã baudot 5 bit, nhưng chúng nhanh chóng trở nên khá hạn chế (chỉ có 32 ký tự có thể, vì vậy về cơ bản chỉ có chữ in hoa và một vài dấu chấm câu, nhưng không đủ "khoảng trắng" cho chữ số) .
Từ đó, khá nhiều máy đã chuyển sang ký tự 6 bit. Điều này vẫn còn khá bất cập - nếu bạn muốn chữ và chữ in hoa và chữ thường (tiếng Anh), chỉ còn lại hai ký tự cho dấu câu, vì vậy hầu hết vẫn chỉ có một trường hợp chữ cái trong một bộ ký tự.
ASCII đã định nghĩa một bộ ký tự 7 bit. Điều đó "đủ tốt" cho nhiều mục đích sử dụng trong một thời gian dài và cũng đã hình thành nên cơ sở của hầu hết các bộ ký tự mới hơn (ISO 646, ISO 8859, Unicode, ISO 10646, v.v.)
Máy tính nhị phân thúc đẩy các nhà thiết kế tạo ra sức mạnh kích thước của hai. Do bộ ký tự "tiêu chuẩn" yêu cầu 7 bit dù sao, việc thêm một bit nữa để có được sức mạnh là 2 (và sau đó, việc lưu trữ đã trở nên rẻ hơn đến mức "lãng phí" một chút cho hầu hết các ký tự cũng được chấp nhận nhiều hơn).
Kể từ đó, các bộ ký tự đã chuyển sang 16 và 32 bit, nhưng hầu hết các máy tính chính chủ yếu dựa trên PC gốc của IBM. Một lần nữa, đủ thị trường đủ thỏa mãn với các ký tự 8 bit mà ngay cả khi PC không đạt đến mức thống trị hiện tại, tôi không chắc mọi người sẽ làm mọi thứ với các ký tự lớn hơn.
Tôi cũng nên thêm rằng thị trường đã thay đổi khá nhiều. Trong thị trường hiện tại, kích thước ký tự được xác định ít hơn bởi phần cứng so với phần mềm. Windows, Java, v.v., đã chuyển sang các ký tự 16 bit từ lâu.
Giờ đây, trở ngại trong việc hỗ trợ các ký tự 16 hoặc 32 bit chỉ là tối thiểu từ những khó khăn vốn có của chính các ký tự 16 hoặc 32 bit, và phần lớn là từ khó khăn trong việc hỗ trợ i18n nói chung. Trong ASCII (ví dụ) phát hiện xem một chữ cái là chữ hoa hay chữ thường, hoặc chuyển đổi giữa hai chữ cái, là vô cùng tầm thường. Trong Unicode / ISO 10646 đầy đủ, về cơ bản, nó phức tạp không thể diễn tả được (đến mức mà các tiêu chuẩn thậm chí không thử - chúng đưa ra các bảng chứ không phải mô tả). Sau đó, bạn thêm vào trong thực tế rằng đối với một số bộ ngôn ngữ / ký tự, ngay cả ý tưởng cơ bản về chữ hoa / chữ thường cũng không được áp dụng. Sau đó, bạn thêm vào trong thực tế là thậm chí hiển thị các ký tự trong một số trong đó vẫn phức tạp hơn nhiều.
Điều đó đủ phức tạp mà đại đa số phần mềm thậm chí không thử. Tình hình đang dần cải thiện, nhưng từ từ là từ hoạt động.