Как оптимизировать запросы MySQL на основе плана EXPLAIN

Рассматривая план запроса EXPLAIN, как определить, какие оптимизации лучше всего сделать?

Я ценю, что одна из первых вещей, которые нужно проверить, заключается в том, используются ли хорошие индексы, но помимо этого я немного тупик. Посредством проб и ошибок в прошлом я иногда обнаружил, что порядок, в котором проводятся объединения, может быть хорошим источником улучшения, но как можно определить, что от просмотра плана выполнения?

В то время как я очень хотел бы получить хорошее общее представление о том, как оптимизировать запросы (предлагаемое чтение очень ценится!), я также понимаю, что часто легче обсуждать конкретные случаи, чем говорить абстрактно. Поскольку я в настоящее время стучу головой о стену с этим, ваши мысли будут очень благодарны:

Я правильно интерпретирую заключительную строку плана выполнения следующим образом:

Если это так, моя проблема заключается в фильтрации, которая происходит на этом заключительном этапе. Если условие не приводит к фильтрации (например, WHERE `Col_1_to_3` IN (1,2,3)), запрос выполняется очень быстро (~ 50 мс); однако, если условие ограничивает выбранные строки (WHERE `Col_1_to_3` IN (1,2)), запрос занимает значительно больше времени (~ 5 с). Если ограничение на одно совпадение (WHERE `Col_1_to_3` IN (1)), оптимизатор предлагает совсем другой план выполнения (который работает чуть лучше 5 с, но все же намного хуже 50 мс). Кажется, что нет лучшего индекса, который можно использовать в этой таблице (если он уже полностью использует первичный ключ для возврата одной строки на результат?).

Как интерпретировать всю эту информацию? Имею ли я право догадываться, что, поскольку такая фильтрация выходных данных происходит в финальной таблице, которая должна быть объединена, значительные усилия тратятся впустую против присоединения к таблице раньше и фильтрации таких строк раньше? Если да, то как определить, когда в план выполнения R2 следует соединить?

В то время как я сопротивлялся, включая запрос и схему, полностью здесь (так как я действительно мог бы знать, что искать, а не просто сказать ответ), я понимаю, что необходимо заранее обсудить:

Ответы

Ответ 1

Зависит от того, что вы собираетесь делать и что такое запрос.

Как правило, для каждой строки в EXPLAIN, которая имеет Using where, вам необходимо использовать ее с помощью столбца index (possible keys и keys). Это ваши фильтры и включают WHERE и ON. Сказав, что Using index еще лучше. Это означает, что существует индекс покрытия, и MySQL может извлекать данные прямо из индекса, а не посещать строку в данных таблицы.

Строки, в которых нет Using where, и он возвращает большое количество строк, следует посмотреть. Они возвращают значения для всех строк в таблице. Я не знаю, каков ваш запрос, поэтому я не знаю, беспокоиться ли здесь. Попробуйте фильтровать набор результатов, чтобы уменьшить размер и повысить производительность.

Обычно вам следует избегать просмотра Using filesort или Using temporary, хотя это плохо, если вы не ожидаете их.

Файлы Filesort обычно появляются с предложением ORDER. Обычно вы хотите, чтобы MySQL использовал индекс покрытия (Using index), чтобы строки возвращались уже по порядку с сервера. Если это не так, то MySQL должен их заказывать позже, используя filesort.

Using temporary может быть плохим, когда он ссылается на производные таблицы, потому что у них нет индексов. Кажется, что вы явно создали временную таблицу с индексами, поэтому здесь это неплохо. Иногда ваш единственный выбор - использовать производную таблицу и, следовательно, Using temporary.