SQL Server - условная агрегация с корреляцией

Его можно было бы рассчитать по-разному, используя специальные оконные функции.

Теперь предположим, что мы не можем использовать оконный SUM и переписать его:

Я использовал CROSS APPLY, потому что мне не нравятся коррелированные подзапросы в списке SELECT colums, а c3 используется дважды.

Все работает так, как должно. Но когда мы смотрим ближе, c2 и c3 очень похожи. Итак, почему бы не объединить их и использовать простое условное агрегирование:

Конечно, я мог обойти его, обертывая другим подзапросом, но он становится немного "уродливым":

Postgresql версия. Единственное отличие: LATERAL вместо CROSS APPLY.

SQLite/MySQL (поэтому я предпочитаю LATERAL/CROSS APPLY):

Я не ищу ответы, которые только показывают, как обойти его.

Я знаю, что SQL-92 не имеет понятия LATERAL. Но версия с подзапросами (например, в SQLite/MySQL) тоже не работает.

Чтобы упростить его, пусть проверяет только коррелированный подзапрос:

Версия выше отлично работает в MySQL/SQLite/Postgresql.

В SQL Server мы получаем ошибку. После того, как он подделал его подзапросом, чтобы "сгладить" его на один уровень, он работает:

Вопрос этого вопроса в том, как SQL Standard регулирует его.

Ответы

Ответ 1

Существует более простое решение:

SELECT c.Customer, c."User", c."Revenue",
       1.0 * Revenue/ NULLIF(c2.sum_total, 0) AS percentage,
       1.0 * c2.sum_running / NULLIF(c2.sum_total, 0) AS running_percentage
FROM t c CROSS APPLY
     (SELECT SUM(c2.Revenue) AS sum_total,
             SUM(CASE WHEN c2.Revenue >= x.Revenue THEN c2.Revenue ELSE 0 END) 
                 as sum_running
      FROM t c2 CROSS JOIN
           (SELECT c.REVENUE) x
      WHERE c."User" = c2."User"
     ) c2
ORDER BY "User", Revenue DESC;

Я не уверен, почему, или если это ограничение находится в стандарте SQL '92. У меня это было довольно хорошо запомнено примерно 20 лет назад, но я не помню этого конкретного ограничения.

Я должен отметить:

Во время стандарта SQL 92 боковые соединения на самом деле не были на радаре. У Sybase определенно не было такой концепции.
Другие базы данных имеют проблемы с внешними ссылками. В частности, они часто ограничивают область охвата на один уровень глубиной.
Сам стандарт SQL имеет тенденцию к высокому политическому (то есть, основанному на поставщиках), а не обусловлен фактическими требованиями пользователей к базе данных. Ну, со временем он движется в правильном направлении.

Ответ 2

В стандарте SQL для LATERAL такого ограничения нет. CROSS APPLY является специфическим расширением от Microsoft (Oracle принял его позже для совместимости), и его ограничения, очевидно, не связаны со стандартом ISO/IEC SQL, поскольку функция MS предшествует стандарту.

LATERAL в стандартном SQL - это просто модификатор для объединений, позволяющий использовать боковые ссылки в дереве соединений. Количество столбцов, на которые можно сослаться, не ограничено.

Я не вижу причины для странного ограничения для начала. Может быть, это потому, что CROSS APPLY изначально предназначался для разрешения табличных функций, что позже было расширено, чтобы разрешить sub- SELECT s.

Руководство Postgres manual объясняет LATERAL так:

Ключевое слово LATERAL может предшествовать элементу sub- SELECT FROM. Это позволяет sub- SELECT для ссылки на столбцы элементов FROM, которые появляются перед ним в списке FROM. (Без LATERAL каждый sub- SELECT оценивается независимо друг от друга и поэтому не может давать перекрестные ссылки на любой другой элемент FROM.)

Версия вашего запроса в Postgres (без более элегантных оконных функций) может быть проще:

SELECT c.*
     , round(revenue        / c2.sum_total, 2) END AS percentage 
     , round(c2.running_sum / c2.sum_total, 2) END AS running_percentage 
FROM   t c, LATERAL (
   SELECT NULLIF(SUM(revenue), 0)::numeric AS sum_total  -- NULLIF, cast once
        , SUM(revenue) FILTER (WHERE revenue >= c.revenue) AS running_sum
   FROM   t
   WHERE  "User" = c."User"
   ) c2
ORDER  BY c."User", c.revenue DESC;

Postgres 9. 4+ имеет более элегантный агрегат FILTER для условных агрегатов.
NULLIF имеет смысл, я предлагаю лишь незначительное упрощение.
Примените sum_total к numeric один раз.
Округлить результат, чтобы соответствовать желаемому результату.