Ответ 1
Да, это правильно. UTF-8 является кодировкой для набора символов Unicode, который поддерживает почти все языки в мире.
Я думаю, что единственное различие заключается в сортировке результатов, разные буквы могут появляться в другом порядке на других языках (акценты, умлауты и т.д.). Кроме того, сравнение a
to ä
может вести себя по-другому в другой сортировке.
Суффикс _ci
означает, что сортировка и сравнение нечувствительны к регистру.
http://www.collation-charts.org/ может вас заинтересовать.