Hệ thống mã hóa utf-8 trên Mac - Cái nào và tại sao là mặc định?


9

Tôi muốn thay đổi hệ thống mã hóa mặc định của mình từ không xác định thành UTF-8 (Tôi nghĩ rằng điều đó sẽ hữu ích). Bây giờ tôi đã thấy nhiều hệ thống mã hóa UTF-8 khác nhau:

mule-utf-8        mule-utf-8-dos
mule-utf-8-mac    mule-utf-8-unix
prefer-utf-8      prefer-utf-8-dos
prefer-utf-8-mac  prefer-utf-8-unix
utf-8             utf-8-auto
utf-8-auto-dos    utf-8-auto-mac
utf-8-auto-unix   utf-8-dos
utf-8-emacs       utf-8-emacs-dos
utf-8-emacs-mac   utf-8-emacs-unix
utf-8-hfs         utf-8-hfs-dos
utf-8-hfs-mac     utf-8-hfs-unix
utf-8-mac         utf-8-unix
utf-8-with-signature     utf-8-with-signature-dos
utf-8-with-signature-mac utf-8-with-signature-unix

Tôi đang sử dụng máy Mac và tôi càng bối rối hơn về các hệ thống mã hóa hfs và mac khác nhau này.

Hiện tại tôi quyết định sử dụng utf-8 như sau dựa trên câu trả lời này :

(setq utf-translate-cjk-mode nil) ; disable CJK coding/encoding (Chinese/Japanese/Korean characters)
(set-language-environment 'utf-8)
;; (set-keyboard-coding-system 'utf-8-mac) ; For old Carbon emacs on OS X only
(setq locale-coding-system 'utf-8)
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)
(unless (eq system-type 'windows-nt)
  (set-selection-coding-system 'utf-8))
(prefer-coding-system 'utf-8)

Nhưng tôi muốn hiểu thêm một số điều tôi đang làm và tại sao một utf-8 khác sẽ tốt hơn như một hệ thống mã hóa mặc định?


1
Câu trả lời này cung cấp nền tảng tốt về các biến thể utf-8 khác nhau.
Juancho

Tôi không nhìn thấy utf-8-hfsvà bạn bè trên emacs của tôi, nhưng có utf-8-nfdthay vào đó. Đó là mã hóa được OS X sử dụng để mã hóa tên tệp. NFD là cho phân rã Canonical Form Form bình thường. NFC được sử dụng phổ biến hơn (C là dành cho Thành phần). Một điểm khác biệt là một chữ cái như å được mã hóa thành một điểm mã duy nhất trong NFC, nhưng hai chữ cái trong NFD (chữ cái a theo sau là một ký tự sáng tác cho vòng ở trên). Bạn có lẽ nên quên đi những mã hóa này; chỉ hy vọng rằng tên tập tin được mã hóa tự động bằng mọi cách.
Harald Hanche-Olsen

@Juancho Cảm ơn - vì vậy tôi cho rằng, tôi ổn khi sử dụng utf-8 làm cài đặt chung. Cảm ơn.
Rainer

@ HaraldHanche-Olsen OK - Vì tôi chỉ sử dụng ASCII cho tên tệp, nên tôi sẽ ổn thôi. Cảm ơn.
Rainer

2
AFAIK, utf-8 là hệ thống mã hóa được sử dụng trong macos cho hầu hết mọi thứ và Emacs nên chọn hệ thống mã hóa phù hợp với bạn. IOW, tôi nghĩ bạn không cần cấu hình . Vui lòng làm rõ lý do tại sao bạn "muốn thay đổi hệ thống mã hóa mặc định của tôi". Có lẽ bạn chỉ đơn giản là gặp lỗi Emacs.
Stefan

Câu trả lời:


0

Emacs có [Menu]->[Options]->[Multilingual Environment]->[Describe Coding System...]hoặc C-h Cđể giải thích sự khác biệt và phân tán các hệ thống mã hóa khác nhau.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.