Кодировка Mysql для всех языков

В настоящее время я разрабатываю веб-сайт, который будет показывать материал практически для любого языка в мире. И им возникают проблемы с выбором наилучшего сопоставления для определения в mysql.

Какой из них лучше всего поддерживать всех персонажей??? Или самое точное???

Или лучше всего преобразовать все символы в unicode?

спасибо

Ответы

Ответ 1

Обычно я использую 8-битный формат преобразования UCS/Unicode, который отлично подходит для любого (ну и большинства) языков

utf8_general_ci

http://dev.mysql.com/doc/refman/5.0/en/charset-unicode.html

Ответ 2

Принятый ответ неверен (возможно, он был прав в 2009 году).

utf8mb4_unicode_ci - лучшая кодировка для широкой языковой поддержки.

Обоснование и подтверждающие доказательства:

Вы хотите использовать utf8mb4 а не utf8 потому что последний поддерживает только 3-байтовые символы, и вы хотите поддерживать 4-байтовые символы. (ссылка)

а также

Вы хотите использовать unicode а не general потому что последний никогда не сортируется правильно. (ссылка)