Как проверить, что TXT файл находится в формате ASCII или UTF-8 в среде Windows?

Я преобразовал TXT файл из ASCII в UTF-8 с помощью UltraEdit. Однако я не уверен, как проверить, находится ли он в формате UTF-8 в среде Windows.

Спасибо!

Ответы

Ответ 1

Текстовые файлы в Windows не имеют формата. Существует неофициальное соглашение, что если файл начинается с кодовой точки спецификации в формате UTF-8, то это UTF-8, но это соглашение не поддерживается повсеместно. Это будет 3-байтовая последовательность "\xef\xbf\xbe", т. ￾ Latin-1.

Ответ 2

Откройте файл в Блокноте. Нажмите "Сохранить как...". В поле "Кодировка:" вы увидите текущий формат файла.

Ответ 3

Откройте файл с помощью Notepad ++ и проверьте меню "Кодировка", вы можете проверить текущую кодировку и/или преобразовать в набор доступных кодировок.

Ответ 4

Откройте его в шестнадцатеричном редакторе и убедитесь, что первые три байта UTF8 BOM (EF BB BF)

Ответ 5

Если вы используете Windows 10 и имеете Windows Subsystem for Linux (WSL), это легко сделать, набрав "file" из оболочки.

Например:

$ file code.cpp

code.cpp: C source, UTF-8 Unicode (with BOM) text, with CRLF line terminators