Khi tôi sử dụng cut
ngày hôm nay, tôi phát hiện ra nó không coi ký tự UTF-8 là ký tự, mà là 3 ký tự vì nó dài 3 byte.
Điều này dường như nói chung đúng với nhiều công cụ.
Có phiên bản nào của coreutils
UTF-8 không?
locale
Đầu ra của tôi :
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
Đây là khi cut
không làm việc
echo 哈哈 | cut -c 2-
��哈
Đầu ra đúng phải là
哈
nếu cut -c
làm việc với các nhân vật đa nhân.
cut
dòng lệnh của bạn ?
echo ßßßß | cut -c 2-
-> �ßßß
( LANG=en_US.UTF-8
)
locale
đúng? Việc đọclocale
lệnh gọi (w / o argument) là gì?