Có một cách đơn giản để in tất cả các ký tự ASCII và số dòng trên mà chúng xuất hiện trong một tập tin bằng cách sử dụng tiện ích dòng lệnh như grep
, awk
, perl
, vv?
Tôi muốn thay đổi mã hóa tệp văn bản từ UTF-8 sang ASCII, nhưng trước khi thực hiện, muốn thay thế thủ công tất cả các phiên bản của các ký tự không phải ASCII để tránh các thay đổi ký tự không mong muốn được thực hiện bởi thói quen chuyển đổi tệp.
LC_ALL=C grep -n -P [$'\x80'-$'\xFF']
, nơi bit đầu tiên tắt đối chiếu.