Наилучшая производительность для получения результатов EAV MySQL как реляционная таблица

Я хочу извлечь результаты из таблиц EAV (сущность-атрибут-значение) или, более конкретно, таблиц сущностей-метаданных (думаю, как wordpress wp_posts и wp_postmeta) как "красиво отформатированная реляционная таблица", чтобы выполнить некоторую сортировку и/или фильтрацию.

Я нашел несколько примеров того, как отформатировать результаты в запросе (в отличие от написания 2 запросов и объединения результатов в коде), но я хотел бы знать "самый эффективный" метод для этого, особенно для больших наборов результатов.

И когда я говорю "наиболее эффективный", я имею в виду что-то вроде следующих сценариев:

поэтому я могу сортировать или фильтровать любое из мета-полей.

Я нашел несколько предложений здесь, но я не могу найти никакого обсуждения того, что работает лучше.

Что лучше вообще, а для фильтрации/сортировки?

Ответы

Ответ 1

Все, что используется с помощью поворота или агрегатов, вероятно, будет быстрее, поскольку они не требуют, чтобы таблица была объединена. Подходы, основанные на объединении, потребуют от оптимизатора выполнить несколько операций подзапроса, а затем объединить результаты. Для небольшого набора данных это может не иметь особого значения, но это может значительно снизить производительность, если вы выполняете аналитический запрос в более крупном наборе данных,

Ответ 2

Лучший способ узнать - это проверить, конечно. Ответ может отличаться в зависимости от размера набора данных, количества различных мета-ключей, их распределения (все ли сущности имеют значения для всех мета-ключей? Или только для некоторых из них?), Настройки вашей базы данных сервером и, возможно, многими другими факторами.

Если бы я предполагал, я бы сказал, что стоимость операций JOIN в варианте 2 будет меньше стоимости GROUP BY и агрегатных функций, необходимых в вариантах 1 и 3.

Итак, я ожидал бы найти вариант 2 быстрее, чем 1 и 3.

Чтобы измерить вариант 4, вам придется учитывать больше факторов, поскольку приложение может находиться на другом сервере, поэтому нагрузки двух серверов (db и application) и количества клиентов, которые будут запрашивать эти результаты, должны быть учитывается.

Sidenote: вам нужно GROUP BY e.ID в вариантах 1 и 3.