Trong một tệp văn bản, có một chuỗi "Tôi không thích điều này".
Tuy nhiên, khi tôi đọc nó thành một chuỗi, nó sẽ trở thành "I don \ xe2 \ x80 \ x98t like this". Tôi hiểu rằng \ u2018 là đại diện unicode của "'". tôi sử dụng
f1 = open (file1, "r")
text = f1.read()
lệnh để đọc.
Bây giờ, có thể đọc chuỗi theo cách mà khi nó được đọc vào chuỗi, nó là "Tôi không thích điều này", thay vì "Tôi không thích xe2 \ x80 \ x98t như thế này như thế này"?
Chỉnh sửa thứ hai: Tôi đã thấy một số người sử dụng ánh xạ để giải quyết vấn đề này, nhưng thực sự, không có chuyển đổi tích hợp nào thực hiện loại chuyển đổi ANSI sang unicode (và ngược lại) này?