Đây là những lý do mà tôi nhớ được đưa ra vì không tạo UTF-8 hoặc một đại diện Unicode khác làm mã hóa ký tự mặc định cho ngôn ngữ kịch bản lệnh Ruby, được phát triển chủ yếu ở Nhật Bản:
- Lý do 1: Hán thống nhất . Các bộ ký tự (không chắc chắn nếu "bảng chữ cái" sẽ chính xác ở đây) được sử dụng ở Trung Quốc, Hàn Quốc và Nhật Bản đều có liên quan, đã phát triển từ lịch sử chung, không chắc chắn về các chi tiết. Liên minh Unicode đã quyết định chỉ lãng phí một điểm mã Unicode duy nhất để mã hóa tất cả các biến thể (tiếng Trung, tiếng Nhật và tiếng Hàn) của cùng một ký tự lịch sử, ngay cả khi ngoại hình của chúng khác nhau ở cả 3 ngôn ngữ. Lý do của họ là, ngoại hình nên được xác định bởi phông chữ được sử dụng để hiển thị văn bản.
Rõ ràng, lý do này được người dùng Nhật Bản coi là vô lý như nó sẽ gây tranh cãi với độc giả tiếng Anh rằng, vì bảng chữ cái Latinh đã phát triển từ bảng chữ cái Hy Lạp, chỉ cần có một điểm mã duy nhất cho tiếng Hy Lạp alpha " α "và Latin" a "và để cho sự xuất hiện được quyết định bởi phông chữ được sử dụng. (Tương tự cho "" = "b", "" = "g", v.v.)
(Lưu ý rằng tôi sẽ không thể đưa các ký tự Hy Lạp vào đây trên stackexchange nếu đó là trường hợp.)
- Lý do 2: Chuyển đổi nhân vật không hiệu quả.
Việc chuyển đổi các ký tự từ Unicode sang mã hóa và ngược lại của Nhật Bản yêu cầu các bảng, nghĩa là không có phép tính đơn giản nào từ giá trị điểm mã Unicode sang giá trị điểm mã kế thừa và ngược lại. Ngoài ra, có một số mất thông tin khi chuyển đổi vì không phải tất cả các điểm mã trong một mã hóa đều có một đại diện duy nhất trong mã hóa khác.
Nhiều lý do có thể đã được đưa ra mà tôi không nhớ nữa.