Моделирование функции group_concat MySQL в Microsoft SQL Server 2005?
Я пытаюсь перенести приложение на основе MySQL на Microsoft SQL Server 2005 (не по своему выбору, а на то, что жизнь).
В исходном приложении мы использовали почти полностью совместимые с ANSI-SQL операторы, с одним существенным исключением - мы часто использовали функцию MySQL group_concat
.
group_concat
, кстати, делает это: учитывая таблицу, скажем, имен сотрудников и проектов...
SELECT empName, projID FROM project_members;
возвращает:
ANDY | A100
ANDY | B391
ANDY | X010
TOM | A100
TOM | A510
... и вот что вы получаете с group_concat:
SELECT
empName, group_concat(projID SEPARATOR ' / ')
FROM
project_members
GROUP BY
empName;
возвращает:
ANDY | A100 / B391 / X010
TOM | A100 / A510
Так что я хотел бы знать: возможно ли написать, скажем, пользовательскую функцию в SQL Server, которая эмулирует функциональность group_concat
?
У меня почти нет опыта использования UDF, хранимых процедур или чего-либо подобного, просто прямого SQL, поэтому, пожалуйста, перепутайте слишком много объяснений:)
Ответы
Ответ 1
Нет РЕАЛЬНОГО простого способа сделать это. Тем не менее, много идей.
Лучший, который я нашел:
SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
SELECT column_name + ','
FROM information_schema.columns AS intern
WHERE extern.table_name = intern.table_name
FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;
Или версия, которая работает правильно, если данные могут содержать символы, такие как <
WITH extern
AS (SELECT DISTINCT table_name
FROM INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM extern
CROSS APPLY (SELECT column_name + ','
FROM INFORMATION_SCHEMA.COLUMNS AS intern
WHERE extern.table_name = intern.table_name
FOR XML PATH(''), TYPE) x (column_names)
CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names)
Ответ 2
Возможно, я немного опоздал на вечеринку, но этот метод работает для меня и проще, чем метод COALESCE.
SELECT STUFF(
(SELECT ',' + Column_Name
FROM Table_Name
FOR XML PATH (''))
, 1, 1, '')
Ответ 3
Возможно, слишком поздно, чтобы принести пользу сейчас, но разве это не самый простой способ сделать что-то?
SELECT empName, projIDs = replace
((SELECT Surname AS [data()]
FROM project_members
WHERE empName = a.empName
ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM project_members a
WHERE empName IS NOT NULL
GROUP BY empName
Ответ 4
SQL Server 2017 представляет новую агрегатную функцию
STRING_AGG ( expression, separator)
.
Объединение значений строковых выражений и разделителей мест между ними. Сепаратор не добавляется в конец строки.
Конкатенированные элементы можно упорядочить, добавив WITHIN GROUP (ORDER BY some_expression)
Для версий 2005-2016 Я обычно использую метод XML в принятом ответе.
В некоторых случаях это может быть неудачным. например если данные, которые будут конкатенированы, содержат CHAR(29)
, вы видите
FOR XML не может сериализовать данные... потому что это содержит символ (0x001D), который не разрешен в XML.
Более надежный метод, который может обрабатывать все символы, - это использовать агрегат CLR. Однако применение такого подхода к конкатенированным элементам является более сложным с этим подходом.
Метод присвоения переменной не гарантируется и его следует избегать в производственном коде.
Ответ 5
Взгляните на проект GROUP_CONCAT на Github, я думаю, что выполняю именно то, что вы ищете:
Этот проект содержит набор пользовательских функций SQLCLR, определяемых пользователем (SQLCLR UDA), которые совместно предлагают аналогичную функциональность функции MySQL GROUP_CONCAT. Существует множество функций, обеспечивающих максимальную производительность на основе требуемой функциональности...
Ответ 6
С помощью приведенного ниже кода вы должны установить PermissionLevel = External в своих свойствах проекта перед развертыванием и изменить базу данных, чтобы доверять внешнему коду (обязательно прочитайте в другом месте об угрозах безопасности и альтернативах [например, сертификатах]), выполнив "ALTER DATABASE database_name SET TRUSTWORTHY ON".
using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;
[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
public struct CommaDelimit : IBinarySerialize
{
[Serializable]
private class StringList : List<string>
{ }
private StringList List;
public void Init()
{
this.List = new StringList();
}
public void Accumulate(SqlString value)
{
if (!value.IsNull)
this.Add(value.Value);
}
private void Add(string value)
{
if (!this.List.Contains(value))
this.List.Add(value);
}
public void Merge(CommaDelimit group)
{
foreach (string s in group.List)
{
this.Add(s);
}
}
void IBinarySerialize.Read(BinaryReader reader)
{
IFormatter formatter = new BinaryFormatter();
this.List = (StringList)formatter.Deserialize(reader.BaseStream);
}
public SqlString Terminate()
{
if (this.List.Count == 0)
return SqlString.Null;
const string Separator = ", ";
this.List.Sort();
return new SqlString(String.Join(Separator, this.List.ToArray()));
}
void IBinarySerialize.Write(BinaryWriter writer)
{
IFormatter formatter = new BinaryFormatter();
formatter.Serialize(writer.BaseStream, this.List);
}
}
Я тестировал это с помощью запроса, который выглядит так:
SELECT
dbo.CommaDelimit(X.value) [delimited]
FROM
(
SELECT 'D' [value]
UNION ALL SELECT 'B' [value]
UNION ALL SELECT 'B' [value] -- intentional duplicate
UNION ALL SELECT 'A' [value]
UNION ALL SELECT 'C' [value]
) X
И дает: A, B, C, D
Ответ 7
Пробовал эти, но для моих целей в MS SQL Server 2005 следующее было наиболее полезным, которое я нашел в xaprb
declare @result varchar(8000);
set @result = '';
select @result = @result + name + ' '
from master.dbo.systypes;
select rtrim(@result);
@Mark, как вы уже упоминали, это был пробельный символ, который вызывал проблемы для меня.
Ответ 8
Чтобы объединить все имена менеджеров проектов из проектов с несколькими менеджерами проектов, пишите:
SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v
where a.project_id=project_id
FOR
XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name
Ответ 9
О J Hardiman ответ, как насчет:
SELECT empName, projIDs=
REPLACE(
REPLACE(
(SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')),
' ',
' / '),
'-somebody-puts-microsoft-out-of-his-misery-please-',
' ')
FROM project_members a WHERE empName IS NOT NULL GROUP BY empName
Кстати, это использование "Фамилии" опечатки или я не понимаю понятие здесь?
В любом случае, спасибо, много парней, потому что это спасло меня довольно долго:)