Tôi đang cố đọc văn bản cyrillic được lưu trữ ở định dạng .txt. Khi tôi mở nó bằng OpenOffice, nó vẫn ổn. Khi tôi mở nó bằng Notepad ++, nó sẽ hiển thị các biểu tượng không thể đọc được. Đặt Windows-1251 trước khi mở tệp không giúp ích quá nhiều. Giá trị mặc định chuyển sang Mã hóa thành UTF-8.
Có cách nào để chuyển đổi văn bản của tôi thành UTF-8 không?
Tập tin có thực sự được mã hóa windows-1251 không? Làm thế nào để bạn suy luận điều đó? Những gì biểu tượng không thể đọc được mà bạn thấy? Vui lòng hiển thị một mẫu nhỏ từ đầu và nội dung dự định để so sánh.
—
Jukka K. Korpela
Đăng ảnh chụp màn hình notepad ++ và nó sẽ cung cấp manh mối cho vấn đề.
—
snowdude