Ответ 1
В командной строке используйте
iconv -f LATIN1 -t UTF8
Вы можете добавить //TRANSLIT
в UTF8
.
У меня есть куча текстовых файлов, которые закодированы в ISO-8851-2 (имеют некоторые польские символы). Есть ли инструмент командной строки для linux/mac, который я мог бы запустить из оболочки script, чтобы преобразовать это в saner utf-8?
В командной строке используйте
iconv -f LATIN1 -t UTF8
Вы можете добавить //TRANSLIT
в UTF8
.
recode latin2..utf8 myfile.txt
Это перезапишет myfile.txt
новой версией. Вы также можете использовать перекодировку без имени файла в качестве канала.
GNU 'libiconv' должен выполнять эту работу.