Как проверить, что TXT файл находится в формате ASCII или UTF-8 в среде Windows?
Я преобразовал TXT файл из ASCII в UTF-8 с помощью UltraEdit. Однако я не уверен, как проверить, находится ли он в формате UTF-8 в среде Windows.
Спасибо!
Ответы
Ответ 1
Текстовые файлы в Windows не имеют формата. Существует неофициальное соглашение, что если файл начинается с кодовой точки спецификации в формате UTF-8, то это UTF-8, но это соглашение не поддерживается повсеместно. Это будет 3-байтовая последовательность "\xef\xbf\xbe"
, т. ￾
Latin-1.
Ответ 2
Откройте файл в Блокноте. Нажмите "Сохранить как...". В поле "Кодировка:" вы увидите текущий формат файла.
Ответ 3
Откройте файл с помощью Notepad ++ и проверьте меню "Кодировка", вы можете проверить текущую кодировку и/или преобразовать в набор доступных кодировок.
Ответ 4
Откройте его в шестнадцатеричном редакторе и убедитесь, что первые три байта UTF8 BOM (EF BB BF
)
Ответ 5
Если вы используете Windows 10 и имеете Windows Subsystem for Linux (WSL), это легко сделать, набрав "file" из оболочки.
Например:
$ file code.cpp
code.cpp: C source, UTF-8 Unicode (with BOM) text, with CRLF line terminators