Дополнительные поля с SQL MIN() и GROUP BY

При использовании функции SQL MIN() вместе с GROUP BY будут ли дополнительные столбцы (не столбцы MIN или один из столбцов GROUP BY) соответствовать данным в соответствующей строке MIN?

Например, для таблицы с именами отделов, именами сотрудников и зарплатой:

SELECT MIN(e.salary), e.* FROM employee e GROUP BY department

Очевидно, я получу две хорошие колонки, минимальную зарплату и отдел. Будет ли имя сотрудника (и любые другие поля сотрудника) из одной строки? А именно строка с MIN (зарплата)?

Я знаю, что, возможно, могут быть два сотрудника с одинаковой (и самой низкой) зарплатой, но все, о чем я беспокоюсь (сейчас), получает всю информацию о (или одном) самом дешевом сотруднике.

Будет ли это выбирать самого дешевого продавца?

SELECT min(salary), e.* FROM employee e WHERE department = 'sales'

По существу, могу ли я быть уверенным, что данные, возвращенные вместе с функцией MIN(), будут соответствовать (или одной) записи с этим минимальным значением?

Если база данных имеет значение, я работаю с MySql.

Ответы

Ответ 1

Если вы хотите получить "дешевого" сотрудника в каждом отделе, у вас будет два варианта с головы:

SELECT
     E.*     -- Don't actually use *, list out all of your columns
FROM
     Employees E
INNER JOIN
     (
          SELECT
               department,
               MIN(salary) AS min_salary
          FROM
               Employees
          GROUP BY
               department
     ) AS SQ ON
     SQ.department = E.department AND
     SQ.min_salary = E.salary

Или вы можете использовать:

SELECT
     E.*
FROM
     Employees E1
LEFT OUTER JOIN Employees E2 ON
     E2.department = E1.department AND
     E2.salary < E1.salary
WHERE
     E2.employee_id IS NULL -- You can use any NOT NULL column here

Второе выражение работает, эффективно говоря, покажите мне всех сотрудников, где вы не можете найти другого сотрудника в том же отделе с более низкой зарплатой.

В обоих случаях, если два или более сотрудника имеют одинаковую зарплату, которые являются минимальными, вы получите их обоих (все).

Ответ 2

SELECT  e.*
FROM    employee e
WHERE   e.id =
        (
        SELECT  id
        FROM    employee ei
        WHERE   ei.department = 'sales'
        ORDER BY
                e.salary
        LIMIT 1
        )

Чтобы получить значения для каждого отдела, используйте:

SELECT  e.*
FROM    department d
LEFT JOIN
        employee e
ON   e.id =
        (
        SELECT  id
        FROM    employee ei
        WHERE   ei.department = d.id
        ORDER BY
                e.salary
        LIMIT 1
        )

Чтобы получить значения только для тех подразделений, у которых есть сотрудники, используйте:

SELECT  e.*
FROM    (
        SELECT  DISTINCT eo.department
        FROM    employee eo
        ) d
JOIN
        employee e
ON   e.id =
        (
        SELECT  id
        FROM    employee ei
        WHERE   ei.department = d.department
        ORDER BY
                e.salary
        LIMIT 1
        )

Конечно, наличие индекса на (department, salary) значительно улучшит все три запроса.

Ответ 3

Самое быстрое решение:

SET @dep := '';
SELECT * FROM (
  SELECT * FROM `employee` ORDER BY `department`, `salary`
) AS t WHERE IF ( @dep = t.`department`, FALSE, ( @dep := t.`department` ) OR TRUE );

Ответ 4

В другом подходе могут использоваться аналитические функции. Вот запрос с использованием аналитических функций и функций ROW_NUM

выберите first_name, оклад от (выберите first_name, зарплата, Row_NUMBER() over (PARTITION BY DEPARTMENT_ID ORDER BY зарплата ASC) как row_count от сотрудников), где row_count = 1;