Trong Notepad ++, mã hóa tệp được đặt thành UTF-8 nhưng mã hóa thực sự là ASCII


0

Tôi cần một số tệp văn bản được mã hóa thành tệp văn bản UTF-8 khi tôi sử dụng chúng với Notepad ++. Tuy nhiên, đôi khi tôi có UTF-8 được chọn làm mã hóa trong Notepad ++, nhưng tệp thực sự ở dạng ASCII. Tôi biết điều này bằng hai phương pháp khác nhau.

Phương pháp đầu tiên là tôi sử dụng một công cụ wiki đơn giản có tên Mobiki trên XAMPP, nó sẽ chỉ hiển thị các ký tự đặc biệt được mã hóa UTF-8 một cách chính xác. Tệp văn bản của tôi không hiển thị chính xác với Mobiki. Phương pháp thứ hai tôi đã sử dụng để kiểm tra trang web http://www.checkfiletype.com . Khi tôi tải các tệp vấn đề lên trang đó, trang web sẽ cho tôi biết rằng tệp được mã hóa theo định dạng ASCII. Các trang khác đang hoạt động với Mobiki được mã hóa theo định dạng UTF-8 do trang web trả về.

Tại sao Notepad ++ không buộc tệp phải là tệp UTF-8 và / hoặc làm cách nào tôi có thể tạo Notepad ++ để làm điều này? Tôi đã thử chọn "Chuyển đổi thành UTF-8" mặc dù Notepad ++ cho thấy tệp đã được mã hóa trong UTF-8, nhưng việc chuyển đổi này không giúp ích được gì.

Tôi tìm thấy một số bài viết diễn đàn khác mô tả một vấn đề tương tự, nhưng giải pháp của họ chỉ là tạo một tệp văn bản mới. Tôi hy vọng tìm thấy một giải pháp mà không cần tạo một tệp văn bản mới.


Cảm ơn vì thông tin. Có cho tệp đó, Notepad ++ hiển thị UTF-8 ở góc dưới bên phải, nhưng điều này có vẻ sai. Tệp có vấn đề với wiki của tôi và trang web checkfiletype.com cho thấy đó là ASCII. Do đó, có lẽ đây là một lỗi như bạn đã chỉ ra có thể xảy ra.
azim58


Có thể tệp được mã hóa dưới dạng UTF-8 có mã "BOM" (dấu thứ tự byte) được mã hóa trong ba byte đầu tiên không? BOM này là vô nghĩa đối với UTF-8 vì chỉ UCS-2 / UTF-16 / UCS-4 quan tâm đến thứ tự byte. Nhưng một số biên tập viên lạm dụng nó như một dấu mã hóa UTF.
Zan Lynx

Câu trả lời:


1

Các tệp chỉ chứa các ký tự ASCII được thể hiện giống hệt nhau trong mã hóa ASCII và UTF-8. Không có sự khác biệt giữa hai trừ khi tệp chứa ít nhất một ký tự không phải ASCII.

Bất cứ điều gì gây ra vấn đề của bạn không phải là mã hóa.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.