Tôi có một tệp .srt hiển thị như vô nghĩa khi tôi mở nó trong gEdit trong ubfox. Vì vậy, tôi muốn chuyển đổi nó thành utf8 để có thể đọc nó.
Khi tôi cố gắng tìm ra những gì mã hóa nó cung cấp:
file -i x.srt
x.srt: text/plain; charset=unknown-8bit
Trong một nỗ lực khác, tôi đã tìm thấy:
find . -type f -print | xargs file
./x.srt: Non-ISO extended-ASCII text, with CRLF line terminators
Ngoài ra tôi đã thử enca:
enca x.srt
enca: Cannot determine (or understand) your language preferences.
Please use `-L language', or `-L none' if your language is not supported
(only a few multibyte encodings can be recognized then).
Run `enca --list languages' to get a list of supported languages.
và
enca -L Persian x.srt
enca: Cannot determine (or understand) your language preferences.
Please use `-L language', or `-L none' if your language is not supported
(only a few multibyte encodings can be recognized then).
Run `enca --list languages' to get a list of supported languages.
Vì vậy, tôi tự hỏi làm thế nào để biết mã hóa và cuối cùng chuyển đổi nó sang một định dạng có thể sử dụng.
other
.
head -n 20 x.srt | od -tx1
)?
iconv -f iso-8859-1 -t utf-8 < file.txt > out.txt