LIMIT 1 очень медленный, для конкретных записей, используя разные клавиши

Я диагностирую прерывистый медленный запрос и обнаружил странное поведение в MySQL, которое я не могу объяснить. Он выбирает другую, неоптимальную стратегию ключа для одного конкретного случая, только при выполнении LIMIT 1.

Таблица (некоторые удаленные столбцы данных без ссылок удалены для краткости)

Это запрос, который работает только медленно для одного конкретного cl_unit_id:

Для всех остальных значений cl_unit_id он использует клавишу log_type_unit_id, которая намного быстрее.

Я не вижу ничего странного в данных для этой "единицы":

Вещи, которые я пробовал, и могут "решить" проблему с помощью:

Снова я могу это сделать, но мне не нравятся побочные эффекты, которые я не понимаю.

b) как сами данные могут влиять на ключевую стратегию? И какой аспект данных, видя, что количество и распространение в индексах кажется типичным.

Ответы

Ответ 1

Mysql выберет план объяснения и использует разные индексы в зависимости от того, что, по его мнению, является статистически лучшим выбором. Для всех ваших первых вопросов это ответ:

Удаление LIMIT 1 - запрос выполняется в миллисекундах и возвращает данные. и → Да, проверьте это, план объяснения хорош.
Переход на LIMIT 2 или другие комбинации, например. 2,3 - работает в миллисекундах. → то же самое. Оптимизатор выбирает другой индекс, потому что внезапно ожидаемые чтения блоков становятся вдвое большими, чем при LIMIT 1 (это только одна возможность).
Добавление подсказки индекса решает ее → Конечно, вы заставляете хороший план объяснений
Добавление второго порядка по первичному ключу также "решает" его → да, потому что по совпадению результат - лучший план объяснения.

Теперь это отвечает только на половину вопросов.

a) почему это происходит только для LIMIT 1?

На самом деле это происходит не только из-за LIMIT 1, но из-за

Перераспределение статистики данных (ориентирует решения оптимизатора)
Предложение ORDER BY DESC. Попробуйте ORDER BY ... ASC, и вы также увидите улучшение.

Это явление прекрасно понимается. читать.

Одно из принятых решений (ниже в статье) - заставить индекс так же, как и вы. Да, иногда это оправдано. В противном случае этот намек был бы полностью уничтожен давно. Роботы не всегда могут быть идеальными: -)

b) как сами данные могут влиять на ключевую стратегию? И что аспект данных, видя как количество и распространение в индексах кажется типичным.

Вы сказали это, распространение - это то, что обычно трахается. Не только оптимизатор может просто принять неправильное решение с точной статистикой, но он также может быть полностью отключен только потому, что дельта на таблице находится под 1/16-м общее количество строк...