Ai đó đã gửi cho tôi một tập tin văn bản. Mặc dù tôi có thể đọc hầu hết các tài liệu, đôi khi có những nhân vật khác thường. Khi tôi mở nó trong VIM, tôi thấy <92> ở vị trí của nó. Khi tôi sử dụng gedit, tôi thấy một nhân vật trông giống như một hình vuông có hai số không và 9 và 4 trong hình vuông.
Có cách nào để giải mã những nhân vật ngộ nghĩnh này trở lại tương đương với con người có thể đọc được không?
Tôi cũng đã chạy như sau trong shell:
johncomputer> file --mime-encoding file.txt
johncomputer> file.txt: : utf-8
Vì tôi nghĩ đó là mã hóa utf8.
Ồ và cũng vậy, đây là một tài liệu văn bản nơi hầu hết các nhân vật đều có thể đọc được. Chỉ một số (không phải tất cả) các nhân vật có dấu đang hiển thị kỳ lạ.
‰PNG
lúc ban đầu, một tệp jpeg tôi đã mở có ÿØÿà JFIF
ở đầu, v.v.
<92>
, đó chắc chắn không phải là UTF-8.