Ответ 1
Хорошая, легкая библиотека, которую я использую успешно, utf8proc.
Я ищу небольшую библиотеку C для обработки строк utf8.
В частности, расщепление на основе разделителей unicode для использования с алгоритмами генерации.
Похожие сообщения предложили:
ICU http://www.icu-project.org/ (я нашел его слишком громоздким для своих целей на встроенных устройствах)
UTF8-CPP: http://utfcpp.sourceforge.net/ (Отлично, но С++ не C)
Кто-нибудь нашел какие-либо независимые от платформы небольшие библиотеки кода для обработки строк unicode (не нужно делать натурализацию).
Хорошая, легкая библиотека, которую я использую успешно, utf8proc.
Там также MicroUTF-8.
UTF-8 специально разработан так, что многие байт-ориентированные строковые функции продолжают работать или нуждаются только в незначительных модификациях.
C strstr
, например, будет работать отлично, если оба входа являются допустимыми, строки UTF-8 с нулевым завершением. strcpy
работает отлично, пока его входная строка начинается с границы символа (например, возвращаемое значение strstr
).
Таким образом, вам может даже не понадобиться отдельная библиотека!