Почему "change_protection" обрабатывает CPU при загрузке большого объема данных в оперативную память?

Мы создали базу данных в памяти, которая ест около 100-150G RAM в одном Vec, который заполняется следующим образом:

perf top показывает, что время в основном выполняется в этой функции "change_protection":

Использование ЦП этой функции возрастает по мере того, как все больше и больше данных загружается в ОЗУ:

Код работает на экземпляре r3.8xlarge AWS EC2, а прозрачная огромная страница уже отключена.

реальный вопрос - почему в этой функции так много накладных расходов?

Ответы

Ответ 1

Кажется, это проблема ОС, а не проблема с этой специфической функцией ржавчины.

Большинство ОС (включая Linux) используют запрос подкачки. По умолчанию Linux не будет выделять физические страницы для вновь выделенной памяти. Вместо этого он будет выделять одну нулевую страницу с разрешениями только для чтения для всей выделенной памяти (т.е. Все страницы виртуальной памяти будут указывать на эту страницу отдельной физической памяти).

Если вы попытаетесь записать в память, произойдет ошибка страницы, будет выделена новая страница, и соответствующие разрешения будут установлены соответствующим образом.

Я предполагаю, что вы видите этот эффект в своей программе. Если вы попытаетесь сделать то же самое во второй раз, это должно быть намного быстрее. Существуют также способы управления этой политикой через sysctl: https://www.kernel.org/doc/Documentation/vm/overcommit-accounting.

Не знаете, почему вы отключили THP, но в этом случае вам могут помочь большие страницы, так как изменение защиты произойдет один раз для каждой большой страницы (2Mib) вместо одного на обычную страницу (4KiB).