Ответ 1
Обычно я использую 8-битный формат преобразования UCS/Unicode, который отлично подходит для любого (ну и большинства) языков
utf8_general_ci
В настоящее время я разрабатываю веб-сайт, который будет показывать материал практически для любого языка в мире. И им возникают проблемы с выбором наилучшего сопоставления для определения в mysql.
Какой из них лучше всего поддерживать всех персонажей??? Или самое точное???
Или лучше всего преобразовать все символы в unicode?
спасибо
Обычно я использую 8-битный формат преобразования UCS/Unicode, который отлично подходит для любого (ну и большинства) языков
utf8_general_ci
Принятый ответ неверен (возможно, он был прав в 2009 году).
utf8mb4_unicode_ci
- лучшая кодировка для широкой языковой поддержки.
Обоснование и подтверждающие доказательства:
Вы хотите использовать
utf8mb4
а неutf8
потому что последний поддерживает только 3-байтовые символы, и вы хотите поддерживать 4-байтовые символы. (ссылка)
а также
Вы хотите использовать
unicode
а неgeneral
потому что последний никогда не сортируется правильно. (ссылка)