Linux AIO: плохое масштабирование

Я пишу библиотеку, которая использует системные вызовы асинхронного ввода-вывода Linux, и хотел бы знать, почему функция io_submit демонстрирует плохое масштабирование файловой системы ext4. Если возможно, что я могу сделать, чтобы io_submit не блокировать большие размеры запросов ввода-вывода? Я уже делаю следующее (как описано здесь):

Чтобы узнать, сколько времени занимает ядро в io_submit, я проверил тест, в котором я создал тестовый файл с 1 Гб, используя dd и /dev/urandom, и неоднократно удалял системный кеш (sync; echo 1 > /proc/sys/vm/drop_caches) и читать все более большие части файла. На каждой итерации я печатал время, затраченное на io_submit, и время, ожидаемое для завершения запроса на чтение. Я провел следующий эксперимент в системе x86-64 под управлением Arch Linux с версией ядра 3.11. Машина имеет SSD и процессор Core i7. На первом графике заканчивается количество прочитанных страниц с временем ожидания io_submit. Второй график отображает время ожидания ожидающего завершения запроса на чтение. Время измеряется в секундах.

Для сравнения, я создал аналогичный тест, который использует синхронный IO с помощью pread. Вот результаты:

Кажется, что асинхронный IO работает так, как ожидалось, чтобы запрашивать размеры около 20 000 страниц. После этого io_submit блокирует. Эти наблюдения приводят к следующим вопросам:

Ниже приведен код, используемый для проверки асинхронного ввода-вывода. Я могу добавить другие списки источников, если вы считаете их релевантными, но я попытался опубликовать только те детали, которые, как я думал, могут иметь значение.

Ответы

Ответ 1

Я понимаю, что очень немногие (если есть) файловые системы на Linux полностью поддерживают AIO. Некоторые операции файловой системы все еще блокируются, а иногда io_submit() косвенно через операции с файловой системой вызывают такие блокирующие вызовы.

Мое понимание заключается в том, что основные пользователи ядра AIO в первую очередь заботятся о том, что AIO действительно асинхронен на необработанных блочных устройствах (т.е. нет файловой системы). по сути, поставщики баз данных.

Вот соответствующее сообщение из списка рассылки linux-aio. (head потока)

Возможно полезная рекомендация:

Добавьте дополнительные запросы через /sys/block/xxx/queue/nr _requests и проблему будет лучше.

Ответ 2

Вам не хватает цели использовать AIO в первую очередь. В ссылочном примере показана последовательность операций [fill-buffer], [write], [write], [write],... [read], [read], [read],.... Фактически вы заполняете данные по трубе. В конце концов, труба заполняется, когда вы достигли предела пропускной способности ввода-вывода для вашего хранилища. Теперь вы заняты, ожидая, что проявляется в вашей линейной работе по снижению производительности.

Рост производительности для записи AIO заключается в том, что приложение заполняет буфер, а затем сообщает ядру начать операцию записи; управление возвращается к приложению немедленно, пока ядро все еще владеет буфером данных и его содержимым; пока ядро не завершит команду ввода-вывода, приложение не должно касаться буфера данных, потому что вы еще не знаете, какая часть (если таковая имеется) буфера фактически сделала его на носитель: измените буфер до ввода-вывода и вы повредили данные, выходящие на носитель.

И наоборот, выигрыш от чтения AIO - это когда приложение выделяет буфер ввода-вывода, а затем сообщает ядру начать заполнять буфер. Control немедленно возвращается в приложение, и приложение должно оставить буфер только до тех пор, пока ядро не сообщит, что оно завершено буфером, отправив сообщение о завершении ввода-вывода.

Таким образом, поведение, которое вы видите, является примером быстрого заполнения конвейера для хранилища. В конце концов данные генерируются быстрее, чем хранилище может сосать данные, а производительность падает до линейности, в то время как конвейер заправляется так быстро, как он опустеет: линейное поведение.

В примерной программе используются вызовы AIO, но она по-прежнему является линейной программой остановки и ожидания.