Là một lập trình viên C, tôi rất ngạc nhiên khi thấy rằng wc -c
(tính số byte) và wc -m
(tính số lượng ký tự) cho kết quả rất khác nhau đối với một tệp văn bản dài của tôi. Tôi đã luôn luôn nói rằng đó sizeof(char)
là 1 byte.
qdii@nomada ~/Documents $ wc -c sentences.csv
102990983 sentences.csv
qdii@nomada ~/Documents $ wc -m sentences.csv
89023123 sentences.csv
Có lời giải thích nào không?