Cout << setw не правильно выравнивается с åäö
Следующий код воспроизводит мою проблему:
#include <iostream>
#include <iomanip>
#include <string>
void p(std::string s, int w)
{
std::cout << std::left << std::setw(w) << s;
}
int main(int argc, char const *argv[])
{
p("COL_A", 7);
p("COL_B", 7);
p("COL_C", 5);
std::cout << std::endl;
p("ABC", 7);
p("ÅÄÖ", 7);
p("ABC", 5);
std::cout << std::endl;
return 0;
}
Это приводит к следующему выводу:
COL_A COL_B COL_C
ABC ÅÄÖ ABC
Если я изменяю "ÅÄÖ" в коде, например, "ABC", затем он работает:
COL_A COL_B COL_C
ABC ABC ABC
Почему это происходит?
Ответы
Ответ 1
Наряду с наложением std::cout
на правильный язык, вам, вероятно, придется переключиться на широкие строки. Например:
void p(std::wstring s, int w)
{
std::wcout << std::left << std::setw(w) << s;
}
int main(int argc, char const *argv[])
{
std::locale loc("en_US.UTF-8");
std::wcout.imbue(loc);
p(L"COL_A", 7);
p(L"COL_B", 7);
p(L"COL_C", 5);
std::wcout << std::endl;
p(L"ABC", 7);
p(L"ÅÄÖ", 7);
p(L"ABC", 5);
std::wcout << std::endl;
return 0;
}
Демо
Ответ 2
Это происходит потому, что эти символы (Ä,...,...) являются символами Юникода, которые, вероятно, кодируются в UTF-8. Это означает, что каждый символ занимает несколько байтов (два в вашем случае, до четырех в общем случае). setw
OTOH не знает о UTF-8 - он просто подсчитывает и, таким образом, выравнивает байты.
Ответ 3
Проблема заключается в том, что ваш исходный код, безусловно, хранится в UTF8, что означает 2 байта для каждой буквы ÅÄÖ, а языковой стандарт для cout не установлен соответствующим образом.
Следовательно, ваш cout считает, что он выводит 3x2 = 6 символов и добавляет только одно пространство для достижения ожидаемого 7. Измените язык с помощью функции imbue(), чтобы установить его в UTF8.