Дополнительные поля с SQL MIN() и GROUP BY
При использовании функции SQL MIN() вместе с GROUP BY будут ли дополнительные столбцы (не столбцы MIN или один из столбцов GROUP BY) соответствовать данным в соответствующей строке MIN?
Например, для таблицы с именами отделов, именами сотрудников и зарплатой:
SELECT MIN(e.salary), e.* FROM employee e GROUP BY department
Очевидно, я получу две хорошие колонки, минимальную зарплату и отдел. Будет ли имя сотрудника (и любые другие поля сотрудника) из одной строки? А именно строка с MIN (зарплата)?
Я знаю, что, возможно, могут быть два сотрудника с одинаковой (и самой низкой) зарплатой, но все, о чем я беспокоюсь (сейчас), получает всю информацию о (или одном) самом дешевом сотруднике.
Будет ли это выбирать самого дешевого продавца?
SELECT min(salary), e.* FROM employee e WHERE department = 'sales'
По существу, могу ли я быть уверенным, что данные, возвращенные вместе с функцией MIN(), будут соответствовать (или одной) записи с этим минимальным значением?
Если база данных имеет значение, я работаю с MySql.
Ответы
Ответ 1
Если вы хотите получить "дешевого" сотрудника в каждом отделе, у вас будет два варианта с головы:
SELECT
E.* -- Don't actually use *, list out all of your columns
FROM
Employees E
INNER JOIN
(
SELECT
department,
MIN(salary) AS min_salary
FROM
Employees
GROUP BY
department
) AS SQ ON
SQ.department = E.department AND
SQ.min_salary = E.salary
Или вы можете использовать:
SELECT
E.*
FROM
Employees E1
LEFT OUTER JOIN Employees E2 ON
E2.department = E1.department AND
E2.salary < E1.salary
WHERE
E2.employee_id IS NULL -- You can use any NOT NULL column here
Второе выражение работает, эффективно говоря, покажите мне всех сотрудников, где вы не можете найти другого сотрудника в том же отделе с более низкой зарплатой.
В обоих случаях, если два или более сотрудника имеют одинаковую зарплату, которые являются минимальными, вы получите их обоих (все).
Ответ 2
SELECT e.*
FROM employee e
WHERE e.id =
(
SELECT id
FROM employee ei
WHERE ei.department = 'sales'
ORDER BY
e.salary
LIMIT 1
)
Чтобы получить значения для каждого отдела, используйте:
SELECT e.*
FROM department d
LEFT JOIN
employee e
ON e.id =
(
SELECT id
FROM employee ei
WHERE ei.department = d.id
ORDER BY
e.salary
LIMIT 1
)
Чтобы получить значения только для тех подразделений, у которых есть сотрудники, используйте:
SELECT e.*
FROM (
SELECT DISTINCT eo.department
FROM employee eo
) d
JOIN
employee e
ON e.id =
(
SELECT id
FROM employee ei
WHERE ei.department = d.department
ORDER BY
e.salary
LIMIT 1
)
Конечно, наличие индекса на (department, salary)
значительно улучшит все три запроса.
Ответ 3
Самое быстрое решение:
SET @dep := '';
SELECT * FROM (
SELECT * FROM `employee` ORDER BY `department`, `salary`
) AS t WHERE IF ( @dep = t.`department`, FALSE, ( @dep := t.`department` ) OR TRUE );
Ответ 4
В другом подходе могут использоваться аналитические функции. Вот запрос с использованием аналитических функций и функций ROW_NUM
выберите first_name, оклад от (выберите first_name, зарплата, Row_NUMBER() over (PARTITION BY DEPARTMENT_ID ORDER BY зарплата ASC) как row_count от сотрудников), где row_count = 1;