Cách xóa các ký tự không phải UTF-8 khỏi tệp văn bản
Tôi có một loạt các tệp tiếng Ả Rập, tiếng Anh, tiếng Nga được mã hóa bằng utf-8. Đang cố gắng xử lý các tệp này bằng tập lệnh Perl, tôi gặp lỗi sau: Malformed UTF-8 character (fatal) Kiểm tra nội dung của các tệp này theo cách thủ công, …