Какой лучший способ выбрать минимальное значение из нескольких столбцов?
Учитывая следующую таблицу в SQL Server 2005:
ID Col1 Col2 Col3
-- ---- ---- ----
1 3 34 76
2 32 976 24
3 7 235 3
4 245 1 792
Каков наилучший способ написать запрос, который дает следующий результат (то есть тот, который дает последний столбец - столбец, содержащий значения minium из Col1, Col2 и Col 3 для каждой строки)?
ID Col1 Col2 Col3 TheMin
-- ---- ---- ---- ------
1 3 34 76 3
2 32 976 24 24
3 7 235 3 3
4 245 1 792 1
UPDATE:
Для пояснения (как я уже сказал в комментариях) в реальном сценарии база данных правильно нормирована. Эти столбцы "массива" не находятся в фактической таблице, а находятся в результирующем наборе, который требуется в отчете. И новое требование состоит в том, что отчет также нуждается в этом столбце MinValue. Я не могу изменить базовый набор результатов, и поэтому я искал T-SQL для удобного "выхода из тюремной карты".
Я попробовал подход CASE, упомянутый ниже, и он работает, хотя он немного громоздкий. Это также сложнее, чем указано в ответах, потому что вам нужно учитывать тот факт, что в одной строке есть два значения min.
В любом случае, я думал, что опубликую свое текущее решение, которое, учитывая мои ограничения, работает очень хорошо. Он использует оператора UNPIVOT:
with cte (ID, Col1, Col2, Col3)
as
(
select ID, Col1, Col2, Col3
from TestTable
)
select cte.ID, Col1, Col2, Col3, TheMin from cte
join
(
select
ID, min(Amount) as TheMin
from
cte
UNPIVOT (Amount for AmountCol in (Col1, Col2, Col3)) as unpvt
group by ID
) as minValues
on cte.ID = minValues.ID
Я скажу заранее, что я не ожидаю, что это обеспечит лучшую производительность, но с учетом обстоятельств (я не могу перепроектировать все запросы только для нового требования столбца MinValue), это довольно элегантный "get из тюремной карты".
Ответы
Ответ 1
Вероятно, есть много способов сделать это. Мое предложение - использовать Case/When, чтобы сделать это. С 3 столбцами это не так уж плохо.
Select Id,
Case When Col1 < Col2 And Col1 < Col3 Then Col1
When Col2 < Col1 And Col2 < Col3 Then Col2
Else Col3
End As TheMin
From YourTableNameHere
Ответ 2
Использование CROSS APPLY
:
SELECT ID, Col1, Col2, Col3, MinValue
FROM YourTable
CROSS APPLY (SELECT MIN(d) MinValue FROM (VALUES (Col1), (Col2), (Col3)) AS a(d)) A
SQL Fiddle
Ответ 3
SELECT ID, Col1, Col2, Col3,
(SELECT MIN(Col) FROM (VALUES (Col1), (Col2), (Col3)) AS X(Col)) AS TheMin
FROM Table
Ответ 4
Лучший способ сделать это, вероятно, не делать этого - странно, что люди настаивают на хранении своих данных способом, который требует "гимнастики" SQL для извлечения значимой информации, когда есть гораздо более простые способы достичь желаемого результата, если вы просто структурируйте свою схему немного лучше :-)
Правильный способ сделать это, на мой взгляд, это иметь следующую таблицу:
ID Col Val
-- --- ---
1 1 3
1 2 34
1 3 76
2 1 32
2 2 976
2 3 24
3 1 7
3 2 235
3 3 3
4 1 245
4 2 1
4 3 792
с ID/Col
в качестве первичного ключа (и, возможно, Col
в качестве дополнительного ключа, в зависимости от ваших потребностей). Тогда ваш запрос становится простым select min(val) from tbl
и вы все равно можете обрабатывать отдельные "старые столбцы" отдельно, используя, where col = 2
в других ваших запросах. Это также позволяет легко расширяться при увеличении количества "старых столбцов".
Это делает ваши запросы намного проще. Общее правило, которое я обычно использую, заключается в том, что если у вас когда-либо есть что-то, похожее на массив в строке базы данных, вы, вероятно, делаете что-то не так и должны подумать о реструктуризации данных.
Однако, если по какой-то причине вы не можете изменить эти столбцы, я бы предложил использовать триггеры вставки и обновления и добавить еще один столбец, для которого эти триггеры установлены на минимум на Col1/2/3
. Это переместит "стоимость" операции с выбора на обновление/вставку, к которому она относится - большинство таблиц базы данных в моем опыте читаются гораздо чаще, чем записываются, поэтому затраты на запись, как правило, со временем становятся более эффективными.
Другими словами, минимум для строки изменяется только при изменении одного из других столбцов, так что именно тогда вы должны его вычислять, а не каждый раз, когда выбираете (что теряется, если данные не изменяются). Затем вы получите таблицу, например:
ID Col1 Col2 Col3 MinVal
-- ---- ---- ---- ------
1 3 34 76 3
2 32 976 24 24
3 7 235 3 3
4 245 1 792 1
Любой другой вариант, который должен принимать решения во время select
обычно является плохой идеей с точки зрения производительности, поскольку данные изменяются только при вставке/обновлении - добавление другого столбца занимает больше места в БД и будет немного медленнее для вставок и обновления, но могут быть намного быстрее для выбора - предпочтительный подход должен зависеть от ваших приоритетов, но, как уже говорилось, большинство таблиц читаются гораздо чаще, чем пишутся.
Ответ 5
Вы можете использовать подход "грубой силы" с помощью твиста:
SELECT CASE
WHEN Col1 <= Col2 AND Col1 <= Col3 THEN Col1
WHEN Col2 <= Col3 THEN Col2
ELSE Col3
END AS [Min Value] FROM [Your Table]
Когда первое условие прекращается, он гарантирует, что Col1 не является наименьшим значением, поэтому вы можете исключить его из остальной части условий. Аналогично для последующих условий. Для пяти столбцов ваш запрос будет выглядеть следующим образом:
SELECT CASE
WHEN Col1 <= Col2 AND Col1 <= Col3 AND Col1 <= Col4 AND Col1 <= Col5 THEN Col1
WHEN Col2 <= Col3 AND Col2 <= Col4 AND Col2 <= Col5 THEN Col2
WHEN Col3 <= Col4 AND Col3 <= Col5 THEN Col3
WHEN Col4 <= Col5 THEN Col4
ELSE Col5
END AS [Min Value] FROM [Your Table]
Обратите внимание, что если существует связь между двумя или более столбцами, то <=
гарантирует, что мы выйдем из инструкции CASE
как можно раньше.
Ответ 6
Если столбцы были целыми числами, как в вашем примере, я бы создал функцию:
create function f_min_int(@a as int, @b as int)
returns int
as
begin
return case when @a < @b then @a else coalesce(@b,@a) end
end
тогда, когда мне нужно будет использовать его, я бы сделал:
select col1, col2, col3, dbo.f_min_int(dbo.f_min_int(col1,col2),col3)
если у вас есть 5 колов, то выше будет
select col1, col2, col3, col4, col5,
dbo.f_min_int(dbo.f_min_int(dbo.f_min_int(dbo.f_min_int(col1,col2),col3),col4),col5)
Ответ 7
Вы также можете сделать это с помощью запроса объединения. По мере увеличения количества столбцов вам нужно будет изменить запрос, но, по крайней мере, это будет прямое изменение.
Select T.Id, T.Col1, T.Col2, T.Col3, A.TheMin
From YourTable T
Inner Join (
Select A.Id, Min(A.Col1) As TheMin
From (
Select Id, Col1
From YourTable
Union All
Select Id, Col2
From YourTable
Union All
Select Id, Col3
From YourTable
) As A
Group By A.Id
) As A
On T.Id = A.Id
Ответ 8
Используйте это:
select least(col1, col2, col3) FROM yourtable
Ответ 9
Это грубая сила, но работает
select case when col1 <= col2 and col1 <= col3 then col1
case when col2 <= col1 and col2 <= col3 then col2
case when col3 <= col1 and col3 <= col2 then col3
as 'TheMin'
end
from Table T
... потому что min() работает только с одним столбцом, а не с столбцами.
Ответ 10
Оба этот вопрос
И этот вопрос попытайтесь ответить на этот вопрос.
Резюме состоит в том, что у Oracle есть встроенная функция для этого: с Sql Server вы застряли либо определяете пользовательскую функцию, либо используете аргументы case.
Ответ 11
Если вы можете создать хранимую процедуру, она может принимать массив значений, и вы можете просто вызвать это.
Ответ 12
select *,
case when column1 < columnl2 And column1 < column3 then column1
when columnl2 < column1 And columnl2 < column3 then columnl2
else column3
end As minValue
from tbl_example
Ответ 13
Если вы используете SQL 2005, вы можете сделать что-то вроде этого:
;WITH res
AS ( SELECT t.YourID ,
CAST(( SELECT Col1 AS c01 ,
Col2 AS c02 ,
Col3 AS c03 ,
Col4 AS c04 ,
Col5 AS c05
FROM YourTable AS cols
WHERE YourID = t.YourID
FOR
XML AUTO ,
ELEMENTS
) AS XML) AS colslist
FROM YourTable AS t
)
SELECT YourID ,
colslist.query('for $c in //cols return min(data($c/*))').value('.',
'real') AS YourMin ,
colslist.query('for $c in //cols return avg(data($c/*))').value('.',
'real') AS YourAvg ,
colslist.query('for $c in //cols return max(data($c/*))').value('.',
'real') AS YourMax
FROM res
Таким образом, вы не теряетесь во множестве операторов:)
Однако это может быть медленнее, чем другой выбор.
Это ваш выбор...
Ответ 14
Небольшой поворот в запросе объединения:
DECLARE @Foo TABLE (ID INT, Col1 INT, Col2 INT, Col3 INT)
INSERT @Foo (ID, Col1, Col2, Col3)
VALUES
(1, 3, 34, 76),
(2, 32, 976, 24),
(3, 7, 235, 3),
(4, 245, 1, 792)
SELECT
ID,
Col1,
Col2,
Col3,
(
SELECT MIN(T.Col)
FROM
(
SELECT Foo.Col1 AS Col UNION ALL
SELECT Foo.Col2 AS Col UNION ALL
SELECT Foo.Col3 AS Col
) AS T
) AS TheMin
FROM
@Foo AS Foo
Ответ 15
Ниже я использую временную таблицу, чтобы получить минимум несколько дат. Первая таблица temp запрашивает несколько связанных таблиц для получения разных дат (а также других значений для запроса), вторая таблица темпов получает различные столбцы и минимальную дату, используя столько проходов, сколько есть столбцов даты.
Это по существу похоже на запрос объединения, требуется такое же количество проходов, но может быть более эффективным (на основе опыта, но потребуется тестирование). Эффективность не была проблемой в этом случае (8000 записей). Можно индексировать и т.д.
--==================== this gets minimums and global min
if object_id('tempdb..#temp1') is not null
drop table #temp1
if object_id('tempdb..#temp2') is not null
drop table #temp2
select r.recordid , r.ReferenceNumber, i.InventionTitle, RecordDate, i.ReceivedDate
, min(fi.uploaddate) [Min File Upload], min(fi.CorrespondenceDate) [Min File Correspondence]
into #temp1
from record r
join Invention i on i.inventionid = r.recordid
left join LnkRecordFile lrf on lrf.recordid = r.recordid
left join fileinformation fi on fi.fileid = lrf.fileid
where r.recorddate > '2015-05-26'
group by r.recordid, recorddate, i.ReceivedDate,
r.ReferenceNumber, i.InventionTitle
select recordid, recorddate [min date]
into #temp2
from #temp1
update #temp2
set [min date] = ReceivedDate
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
where t1.ReceivedDate < [min date] and t1.ReceivedDate > '2001-01-01'
update #temp2
set [min date] = t1.[Min File Upload]
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
where t1.[Min File Upload] < [min date] and t1.[Min File Upload] > '2001-01-01'
update #temp2
set [min date] = t1.[Min File Correspondence]
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
where t1.[Min File Correspondence] < [min date] and t1.[Min File Correspondence] > '2001-01-01'
select t1.*, t2.[min date] [LOWEST DATE]
from #temp1 t1 join #temp2 t2 on t1.recordid = t2.recordid
order by t1.recordid
Ответ 16
Для нескольких столбцов лучше всего использовать оператор CASE, однако для двух числовых столбцов я и j вы можете использовать простую математику:
min (i, j) = (i + j)/2 - abs (i-j)/2
Эта формула может быть использована для получения минимального значения нескольких столбцов, но его действительно грязное прошлое 2, min (i, j, k) будет min (i, min (j, k))
Ответ 17
SELECT [ID],
(
SELECT MIN([value].[MinValue])
FROM
(
VALUES
([Col1]),
([Col1]),
([Col2]),
([Col3])
) AS [value] ([MinValue])
) AS [MinValue]
FROM Table;
Ответ 18
Если вы знаете, какие значения вы ищете, как правило, код состояния, может быть полезно следующее:
select case when 0 in (PAGE1STATUS ,PAGE2STATUS ,PAGE3STATUS,
PAGE4STATUS,PAGE5STATUS ,PAGE6STATUS) then 0 else 1 end
FROM CUSTOMERS_FORMS
Ответ 19
Я знаю, что этот вопрос старый, но я все еще нуждался в ответе и не был доволен другими ответами, поэтому мне пришлось придумать свой собственный, который искажает ответ @paxdiablo.
Я приехал из страны SAP ASE 16.0, и мне нужно было только посмотреть статистику определенных данных, которые ИМХО достоверно хранятся в разных столбцах одной строки (они представляют разное время - когда планировалось прибытие чего-то, что ожидалось, когда действие началось и наконец то, что было фактическим временем). Таким образом, я переместил столбцы в строки временной таблицы и подготовил свой запрос, как обычно.
NB Не единственное решение для всех!
CREATE TABLE #tempTable (ID int, columnName varchar(20), dataValue int)
INSERT INTO #tempTable
SELECT ID, 'Col1', Col1
FROM sourceTable
WHERE Col1 IS NOT NULL
INSERT INTO #tempTable
SELECT ID, 'Col2', Col2
FROM sourceTable
WHERE Col2 IS NOT NULL
INSERT INTO #tempTable
SELECT ID, 'Col3', Col3
FROM sourceTable
WHERE Col3 IS NOT NULL
SELECT ID
, min(dataValue) AS 'Min'
, max(dataValue) AS 'Max'
, max(dataValue) - min(dataValue) AS 'Diff'
FROM #tempTable
GROUP BY ID
Это заняло около 30 секунд в исходном наборе из 630000 строк и использовало только индексные данные, поэтому не для запуска в критичном по времени процессе, а для таких вещей, как однократная проверка данных или отчет на конец дня, вы можете быть хорошо (но проверьте это со своими сверстниками или начальством, пожалуйста!). Основным преимуществом этого стиля для меня было то, что я мог легко использовать больше/меньше столбцов и изменять группировку, фильтрацию и т.д., Особенно после копирования данных.
Дополнительные данные (columnName
, max
es,...) должны были помочь мне в моем поиске, поэтому они могут вам не понадобиться; Я оставил их здесь, чтобы, возможно, зажечь некоторые идеи :-).